智能工作监督器

在线体验

预览截图

项目名称：智能工作监督器

团队成员：原泽宇

指导老师：董宝光

项目概述：

随着社会发展，需要独立学习工作的人群逐渐增多，一些人难免会出现在学习工作中拖延、不自律的情况，影响学习工作效率。本产品旨在开发一款基于人工智能技术的智能监督设备，通过整合语音识别、图像分析及大模型技术，为学生、职场新人以及自由职业者等群体提供实时监测与智能提醒，帮助用户克服拖延、不自律等问题。同时可实现AI自主监督与实时反馈功能，满足用户对智能化、个性化自律工具的需求，填补市场空白。

关键技术：

本项目采用 “双模型协同 + 语音输出” 的技术架构，核心流程如下：

视觉识别层：通过摄像头实时捕获画面，调用阿里 Qwen-VL 大模型识别包括 “专注工作”“玩手机”“吃东西”“喝水”“打瞌睡” 等多种行为，并生成文字描述。

语言处理层：将 Qwen-VL 输出的行为描述（如 “用户正在低头看手机”）传入 Deepseek 模型，通过预设的提示词规则生成回应内容。

语音输出层：将 Deepseek 生成的文本通过阿里云 cozy-voice 语音合成转换为语音。

在具体实现过程中要用到API，要创建Qwen-VL和Deepseek的API，还有阿里云的OSS服务（储存用），并将密钥写到代码中。通过API打通QwenVL、阿里云和Deepseek，可以实现图像识别与文字反馈。

使用的AI工具和云服务如下：