智能工作监督器

预览截图

项目名称:智能工作监督器

团队成员:原泽宇

指导老师:董宝光

项目概述:

随着社会发展,需要独立学习工作的人群逐渐增多,一些人难免会出现在学习工作中拖延、不自律的情况,影响学习工作效率。本产品旨在开发一款基于人工智能技术的智能监督设备,通过整合语音识别、图像分析及大模型技术,为学生、职场新人以及自由职业者等群体提供实时监测与智能提醒,帮助用户克服拖延、不自律等问题。同时可实现AI自主监督与实时反馈功能,满足用户对智能化、个性化自律工具的需求,填补市场空白。

关键技术:

本项目采用 “双模型协同 + 语音输出” 的技术架构,核心流程如下:

视觉识别层:通过摄像头实时捕获画面,调用阿里 Qwen-VL 大模型识别包括 “专注工作”“玩手机”“吃东西”“喝水”“打瞌睡” 等多种行为,并生成文字描述。

语言处理层:将 Qwen-VL 输出的行为描述(如 “用户正在低头看手机”)传入 Deepseek 模型,通过预设的提示词规则生成回应内容。

语音输出层:将 Deepseek 生成的文本通过阿里云 cozy-voice 语音合成转换为语音。

在具体实现过程中要用到API,要创建Qwen-VL和Deepseek的API,还有阿里云的OSS服务(储存用),并将密钥写到代码中。通过API打通QwenVL、阿里云和Deepseek,可以实现图像识别与文字反馈。


使用的AI工具和云服务如下




提供给AI的提示词如下:


硬件层面:
采用高清广角摄像头来进行拍摄,确保拍摄的清晰性与较广的画面范围;可搭配支架使用,灵活方便(实物如下)。




应用前景或落地或转化及获奖情况
核心应用场景
学习场景:学生在家中或者宿舍学习时,将智能工作监督装置放置在书桌上,它可以实时监测学生的学习状态,并及时提醒。 
办公室场景:职场人士在办公位上使用,装置能够发出提示,帮助其保持专注工作。
个人工作室场景:自由职业者在自己的工作室工作时,该装置可根据设定的任务计划,监督任务进度,确保按时完成工作。
获奖情况:在2025年第八届中国高校智能机器人创意大赛北京市赛中获得二等奖

点赞(0)

作品体验