豆包推出视频通话功能,多模态入口划时代更新。5月23日,豆包App实时通话功能全面升级,新增视频聊天问答功能。用户在工作、生活、学习场景中遇问题,可随时通过视频与豆包对话获取解答。视频通话功能使用便捷,只需将豆包App更新至最新版后,于对话框选择“打电话”,点击“视频通话”即可开启。
技术层面,视频通话功能基于豆包视觉理解模型的重大升级,具备多模态信息融合处理、复杂任务处理及实时联网检索三大核心能力,实现从静态图像到动态视频的跨越。技术团队优化模型架构,将平均响应延迟控制在 800毫秒内,且模型具备情境保持能力,为场景化AI交互筑牢基础。
AI交互从“一问一答”到实时“看 听”跨越,有望催生更多应用创新。相比传统AI助手一问一答的交互方式,豆包视频通话功能通过视觉信息的引入构建自然语境,降低了用户描述需求,整理prompt的门槛。与普通图像识别相比,其连续互动特性允许用户在对话中补充信息,助力 AI 修正理解偏差,使交互更自然精准。据网经社,在博物馆场景中,用户提问准确率较纯语音输入提升 40%;多模态交互令老年用户使用意愿提高65%。我们认为此次升级标志着AI交互的重大突破,随着模型与硬件技术的持续发展,未来有望催生更多创新交互方式与应用场景。
建议关注:
算力:寒武纪、海光信息、阿里巴巴、奥飞数据、协创数据、海南华铁、潍柴重机、科华数据、大位科技、新易盛、中际旭创、胜宏股份、玉柴国际、亿田智能、宏景科技、云赛智联、圣阳股份、润建股份、弘信电子、有方科技、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科技、杰创智能、朗科科技等。
Agent:金山办公、泛微网络、金蝶国际、鼎捷数智、拓尔思、赛意信息、麦迪科技、用友网络、宇信科技、京北方、中科金财、致远互联、金桥信息、汉得信息、朗新集团、上海钢联、新致软件、同花顺、信雅达、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、软通动力、光云科技、科大讯飞、万兴科技、海天瑞声、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。
风险提示: