智能工作监督器
预览截图
项目名称:智能工作监督器
团队成员:原泽宇
指导老师:董宝光
项目概述:
随着社会发展,需要独立学习工作的人群逐渐增多,一些人难免会出现在学习工作中拖延、不自律的情况,影响学习工作效率。本产品旨在开发一款基于人工智能技术的智能监督设备,通过整合语音识别、图像分析及大模型技术,为学生、职场新人以及自由职业者等群体提供实时监测与智能提醒,帮助用户克服拖延、不自律等问题。同时可实现AI自主监督与实时反馈功能,满足用户对智能化、个性化自律工具的需求,填补市场空白。
关键技术:
本项目采用 “双模型协同 + 语音输出” 的技术架构,核心流程如下:
视觉识别层:通过摄像头实时捕获画面,调用阿里 Qwen-VL 大模型识别包括 “专注工作”“玩手机”“吃东西”“喝水”“打瞌睡” 等多种行为,并生成文字描述。
语言处理层:将 Qwen-VL 输出的行为描述(如 “用户正在低头看手机”)传入 Deepseek 模型,通过预设的提示词规则生成回应内容。
语音输出层:将 Deepseek 生成的文本通过阿里云 cozy-voice 语音合成转换为语音。
在具体实现过程中要用到API,要创建Qwen-VL和Deepseek的API,还有阿里云的OSS服务(储存用),并将密钥写到代码中。通过API打通QwenVL、阿里云和Deepseek,可以实现图像识别与文字反馈。
使用的AI工具和云服务如下:


提供给AI的提示词如下:


©当前作品的著作权归作者所有。本站所有软件均来源于网络,仅供学习使用,请支持正版!
转载请注明出处: iMuseum数字创新博物馆 » 智能工作监督器