新闻中心

国内首款AI助盲眼镜发布,通义千问驱动解决视障出行难题

2025-12-13
浏览次数:
返回列表

近日,杭州瞳行科技正式推出国内首台ai助盲眼镜,致力于以人工智能技术切实缓解视障人士在日常出行与生活场景中面临的现实困境。该产品已完*套化设计并上架销售,包含ai眼镜本体、专属配套手机、可穿戴遥控指环及一根智能适配盲杖,用户可一站式购齐、即开即用。

这款眼镜功能全面,覆盖出行避障、物品查找与文本识别、语音交互助手、一键紧急求助亲友等核心需求。在出行模式下,系统端到端延迟控制在约300毫秒以内,响应极为迅捷,能精准匹配人体自然步频——每迈出一步,即可同步获取实时路况语音提示。

硬件层面,设备搭载121度超广角双摄像头模组,协同手机端强大算力与指环式交互操作,构建起“感知—决策—反馈”的闭环式人机协作体系。技术实现上,并未采用单一模型架构。瞳行融合自研视觉理解模型与通义千问Qwen-VL多模态大模型、OCR识别系列模型,并针对不同使用情境进行精细化参数调优与任务分流。

例如,在避障类场景中,系统需在毫秒级内判断前方是否存在大型障碍物及其可通行性(如能否迈过台阶),此时模型输出高度精简、指令明确,如“正前方有三级台阶,左侧2米处有慢行行人”,信息被压缩为可立即执行的动作指引;而在找店点餐类场景中,系统需准确识别招牌文字、菜单段落排版、窗口价目表等多源异构信息,会对图像内容进行深度结构化解析与语义整合,再通过语音清晰复述关键要素,处理耗时略长但信息维度更完整、上下文更连贯。

研发团队在模型选型与硬件配置之间进行了大量权衡取舍。为保障避障响应的极致低延时,他们将大模型能力按场景解耦:对强时效性任务(如动态避让)优先启用轻量化本地推理逻辑,大模型仅作辅助校验;而对依赖深层语义解析与长文本理解的任务(如菜单解读、公告阅读),才激活高复杂度模型参与运算。

硬件选型亦围绕实用性展开:超宽视角双摄显著缩小视觉盲区;指环支持无感切换功能模式与触发SOS求助;手机承担主要计算负载与网络连接任务;传统盲杖则予以保留并做智能化适配,延续用户既有使用习惯。

出行难,长期是视障群体最突出的生活痛点。我国视力障碍人口逾1700万,日常通勤高度依赖电子导航与他人协助,却频繁遭遇“最后十米”导航失效问题——门牌模糊不清、出入口被临时占用、楼道标识缺失或位置隐蔽等情形屡见不鲜;加之公共服务响应存在不确定性,不少视障者被迫大幅减少外出频次,甚至长期居家。

本款AI助盲眼镜正是直击上述高频难点,重点强化复杂城市环境下的毫秒级环境感知能力与自然语言交互体验。从行业方法论看,瞳行采取“通用基座模型+垂直场景微调”的技术路径,提升模型复用效率与落地适配性。

市场与技术总监曾指出:“在大模型尚未普及的阶段,独立部署高性能AI算力的成本极高,中小创业公司往往难以承受。如今随着通义千问等高质量开源基础模型的成熟与算力基础设施成本持续下降,企业得以将资源重心转向场景工程打磨与用户体验优化,真正让这类软硬一体的助残硬件具备规模化落地与可持续运营的商业基础。”

拾贝 拾贝

一键同步微信读书所有笔记和划线,并在新标签页回顾

拾贝 186 查看详情 拾贝

该产品在多样化真实场景中展现出差异化性能表现:

  • 在人流密集街区,系统侧重对移动目标的轨迹预测与简洁化语音提示;
  • 行至公交站或地铁口时,自动识别线路指示牌与到站车次信息,优先播报与用户目的地强相关的关键字段;
  • 进入餐厅或需阅读纸质材料时,OCR模块将图像实时转为可读文本,大模型进一步提炼要点并逐句语音播报;
  • 若识别置信度不足或结果存疑,系统主动提示用户确认,或一键发起远程求助,即时向预设联系人发送当前位置与现场语音片段。

操作流程同样贴合用户实际:开机佩戴后,可通过语音或指环快捷选择“出行”或“阅读”主模式;指环支持多档位切换子功能;遇突发状况仅需单击指环,即可自动上传定位坐标与最近10秒音频至紧急联系人终端。

从企业发展策略来看,瞳行坚持“自研模型打底 + 大模型赋能”的双轨协同路线:自研模型专注高速响应与边缘端稳定执行,大模型负责高阶语义理解与复杂上下文推理,二者经由场景驱动的任务调度机制与联合微调,在速度与精度间取得动态平衡。

面向市场,整套“眼镜+手机+指环+盲杖”组合设计,既降低初次使用门槛,又尊重传统辅具使用惯性,是一种务实且具包容性的产品哲学。关于成本控制与长期可持续性,算力成本的实质性下降成为关键支点——过去同类项目常因算力投入过高导致资金链承压,如今依托成熟的基础模型生态,企业可聚焦于真实场景的问题定义、交互设计与服务闭环建设。

目前,该AI助盲眼镜已全面开放购买,用户可直接选购含眼镜主机、定制手机、遥控指环及智能盲杖在内的完整套装。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜



以上就是国内首款AI助盲眼镜发布,通义千问驱动解决视障出行难题的详细内容,更多请关注其它相关文章!


# 首款  # 老域名seo优化  # 新网站如何做网站推广赚钱  # 优化一个网站推荐的软件  # 鄂州网站建设维护  # 德令哈网站推广优化  # 聊城网站建设优化公司  # 南宁seo付费推广  # 崂山网站建设运营  # 南岸靠谱的seo电话  # 关键词排名看哪个  # 逐句  # 两月  # 通义千问  # 国内  # 好用  # 下载地址  # 闭环  # 景中  # 一键  # 拾贝  # qwen  # 大模型  # ai  # 人工智能 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 电脑type-c接口是什么意思  为什么进行域名解析  新版路由器如何设置路由命令  开机如何运行dos命令提示符  春运抢票在哪儿抢票  一帧是多少秒  单身交友必备软件  台达变频器power灯是什么意思  空调power灯一直闪是什么意思  所有删除的聊天记录都可以恢复吗?  如何自己加装固态硬盘  2025年哪个局域网聊天软件好用  如何更新typescript  路由器power灯一直亮是什么意思  高市盈率是什么意思  固态硬盘2m如何修复  shell如何执行sql脚本命令行  j*a怎么讲数组打印  命令行如何打开文件  如何用命令下载服务器网站  typescript在浏览器里怎么用  一分钟等于多少秒  meet是什么意思  苹果16有哪些改装模式  广东春运几点抢票  哪些编程软件需要typescript  unix时间戳是什么意思  税负是什么意思  固态硬盘电脑如何设置  折叠屏手机选择哪个好  什么网址不能域名解析  夸克高考为什么不靠谱  苹果16粉色还有哪些机型  干股是什么意思  如何打开管理员命令提示符  夸克转存中是什么意思  车子上面nfc功能是什么意思  平板键盘nfc功能是什么意思  联想的固态硬盘如何  debian10和ubuntu20哪个好用  power在坐标轴中是什么意思  faq是什么意思  液位传感器power是什么意思  ai如何重复使用上一命令  ka是什么意思  自己如何安装固态硬盘  没基础做单片机怎么样  单片机的速度怎么求  cos150度等于多少  j*a数组逆序怎么写 

搜索