近日,,,财联社专访汤姆猫董事长朱志刚,,,以下是此次专访内容:
15年前,,,一只“会说话的猫”在智能手机屏幕上迅速走红,,,以轻巧幽默的方式定义了智能手机时代“人与虚拟角色互动”的基础范式。。。。如今,,这只风靡全球的虚拟形象正在以AI情感陪伴机器人的全新身份,试图重构一个巨大的潜在市场。。。。
“汤姆猫AI机器人的应用场景是现实存在且十分明确的,,,,那就是实现对人类更好的陪伴与情感交流。。。”近期,,,汤姆猫董事长朱志刚表示,,,,汤姆猫致力于成为全球最会聊天的AI机器人。。。
从“会说话的汤姆猫”到“会聊天的汤姆猫”,,不只是单纯的产品迭代,,,,更是一次关于技术温度和情感连接的重构。。在大模型技术不断发展的背景下,,,,作为IP持有方的汤姆猫公司正推动一次底层战略转型:从以内容和互动为主的数字产品,,,跃升至“硬件+内容+服务”构建的AI陪伴版图。。。
情感为基,,,重塑AI陪伴“刚需”
汤姆猫的进化不是偶然。。。。自2010年上线以来,,这一IP已累计获得超过全球240亿人次下载,,,,全球月活跃用户(MAU)最高达到4.7亿人次。。。。在朱志刚看来,,,会说话的汤姆猫定义了智能手机时代“人与虚拟角色互动”的基础范式,,,长久以来用户对汤姆猫的情感连接,,,不只是娱乐,,更是一种轻量级陪伴的情绪寄托,,,属于人工智能的雏形产品。。。。
“但相当长一段时间内,,,自然语言处理(NLP)与人工智能技术停滞不前,,,,面对还不会思考的汤姆猫,,公司将‘会说话的汤姆猫’升级成‘会聊天的汤姆猫’的愿望,,也迟迟难以实现。。”
ChatGPT横空出世带来的兴奋感,,,,朱志刚仍记忆犹新,,这意味着公司长期探索的目标——会聊天的汤姆猫,,距离落地实现近了一大步。。。。
然而,,,,“会聊天”不是简单地接入大模型即可,,,,接入大模型只是具备了知识问答、、内容生成的能力,,,,并不具备情感连接。。。人类聊天有别于其他信息传递的本质特征正是情感连接。。。在朱志刚看来,,,,“会聊天” 的内涵,,,远不止于知识与信息的传递,,更体现在能让人收获积极的情绪体验,,进而获取珍贵的信任感与归属感。。
朱志刚介绍,,,,汤姆猫的受众极其广泛,,比如3-12岁的儿童群体,,正处于认知快速发展期,,,,具有强烈的好奇心和探索欲,,提问和对话是他们探索世界的重要方式,,,,因此对即时互动和响应有较高的要求。。然而现实是,,,,大多数父母很难随时回应孩子“十万个为什么”的提问,,,,这正是汤姆猫AI机器人可以承担的角色空位,,,,提供教育与情感支持,,,成为儿童时代最快乐的小伙伴。。。
针对老年群体,,,尤其是独居老年人,,,AI汤姆猫的温暖陪伴能够为他们的日常增添欢声笑语,,,,帮助他们提升生活质量和幸福感,,,获得美好的情感慰藉。。。
针对自闭症患者等特殊群体,,,,汤姆猫AI机器人可用于早期干预和语言训练,,,,同时也成为患者在封闭环境中的私交同伴,,是患者信得过的朋友。。。。
现在的年轻人,,,,也可能遇到生活节奏快,,,离家远,,,感到孤单需要情绪抚慰的时候,,能随时随地有AI汤姆猫说说话,,,,也可以缓解压力。。。可以说“人终其一生都在找一个能说话的人。。。。”
不满足于“问答准确”,,更追求“情感连接”,,,,可以说,,,,汤姆猫选择AI陪伴机器人赛道是一种使命必然。。。。
“当情感陪伴垂直模型的细腻与通用大模型的深邃在汤姆猫交相融合,,,,汤姆猫终于拥有了记忆与思考的能力,,,,人类也将拥有最好的情感与交流的伴侣。。。”在公司自研的情感陪伴垂直模型投产后,,朱志刚即满怀信心。。。。
情感建模+多模态交互,,,,打造最会聊天的机器人
“为了更精准地识别用户情绪,,,,进而提供必要的情感支持,,,,公司与西湖心辰合作开发的情感模型,,,专注于用户情绪识别与长期记忆功能,,能主动发起对话并根据历史交互调整反馈策略,,如根据用户情绪状态提供安慰或鼓励。。。。”朱志刚详细介绍了从用户的需求和体验入手推导产品背后的底层技术实现路径。。。。
相较于通用大模型对话助手,,汤姆猫AI机器人在语言风格和表达方式上更具拟人化与友好性。。。比如当孩子问“黑洞是什么”,,机器人不会只用晦涩的天体物理术语,,而会说:“黑洞就像家里一个巨大的吸尘器……”甚至还会调用过往聊天中提及的宠物话题,,回答“量子纠缠就像你家里的猫(雯雯)和狗(厚福),,虽然相隔很远,,,,却能感受到彼此的存在……”,,如此通俗易懂的比喻帮助孩子理解科学现象的同时引发孩子的情感联想。。。
“对于年纪小不能完整、、、清晰的表达的小朋友,,我们首先利用语音识别技术(ASR)精准捕捉儿童模糊发音与短词汇,,,通过意图识别模型了解孩子真正想表达的内容,,,,再通过大模型的上下文理解与生成能力,,给出准确又有趣的回答。。。鼓励小朋友的每一次表达,,,逐步培养逻辑性表达习惯,,,,解决‘童言碎片化’难题,,助力语言能力进阶。。。”
产品还具备情绪雷达和主动聊天功能,,,,通过语音识别用户情绪,,,,并动态调整互动策略,,,其自主研发的TTS模型经过数千小时的训练,,,确保输出的声音具备IP识别度和情感感染力。。。如用户情绪低落时,,,汤姆猫机器人将用“难过的声音”进行共情并给予安慰,,真正发挥“会聊天”的陪伴价值。。。。
在陪伴过程中,,,汤姆猫AI机器人具备短期和长期记忆的能力,,,能记住用户的点点滴滴,,,,并在持续对话过程中调用记忆内容自学习,,,越聊越懂用户,,,成为用户越来越信赖的伙伴。。
为进一步打造更加真实的聊天交互,,,汤姆猫AI机器人在嵌入式软件和硬件上同样做了诸多创新。。。。该机器人产品可模拟丰富的表情(如眨眼、、、微笑)和动作(如转头、、、、耳朵摆动),,,与语音内容同步呈现拟人化互动。。。例如,,当用户表达悲伤时,,机器人会呈现“关切”表情;用户输入语音时,,,,汤姆猫机器人的耳朵会一上一下,,,,表示其在认真倾听。。。。
同时,,汤姆猫AI机器人还是一个能调用大模型能力、、博古通今的AI助手,,,其采用了MoE(Mixture of Experts)混合专家模型架构,,,,具备根据不同任务需求选择最优模型组合的能力。。。朱志刚透露,,通过MoE架构结合外部技术资源(如豆包、、、、DeepSeek等模型),,在意图识别等功能上形成补充,,,该模型架构的开放性有助于公司持续构建“硬件+内容+服务”的生态闭环,,未来更好地服务于不同年龄群体的陪伴需求。。。。
硬件+内容+服务,,一体化生态闭环成形
当前市场中,,,很多AI玩具厂商仅通过对接大模型API来构建对话系统,,,,缺乏差异化与持续运营能力。。。而汤姆猫的策略,,,,是将IP内容、、、技术架构与硬件设计深度融合,,,,构建“硬件+内容+服务”的一体化生态系统。。。
从硬件上看,,,,产品采用自主设计的嵌入式系统与多传感器架构;在内容上,,,公司整合了过往十余年积累的动画、、音频、、、游戏互动资源,,实现内容联动与持续更新;在服务层面,,,,开发了配套的APP与小程序,,支持家长查看孩子的聊天摘要、、、识别情绪变化,,,,同时保护隐私,,不记录敏感对话数据。。
此外,,,,汤姆猫还特别关注银发用户群体。。在产品中嵌入了健康知识问答、、生活提醒等功能,,满足老年人日常陪伴与辅助需求。。已有用户反馈称:“现在家里有汤姆猫,,,连我都觉得安静的日子变得热闹了。。”
朱志刚透露,,,,接下去,,,,汤姆猫将引入更前沿的技术,,,,不断丰富产品形态和功能,,满足不同用户在不同场景下的使用需求,,,持续提升用户体验。。例如,,,通信方式上,,,将从WiFi+BT向4G Cat1方向演进;材质方面,,,,将从单一硅胶材质向毛绒及其他材质方向演进;大模型方面,,,从云端大模型向端侧大模型演进,,带来隐私、、、、安全、、低延时的体验;运动能力方面,,从桌面向室内自由活动方向演进;打断方式上,,从唤醒词打断向语音打断方向演进。。。
抢滩万亿级AI陪伴赛道,,,构建面向未来的技术护城河
市场机构ARK Invest预测,,到2030年全球AI陪伴市场将从当前每年3000万美元跃升至700亿至1500亿美元,,年增长率预计超过200%。。。。在这条高速成长的“长坡厚雪”赛道中,,,汤姆猫已经率先完成技术、、内容、、、、交互系统的整合闭环,,,并实现了商业化落地。。。。
朱志刚指出:“AI陪伴赛道足够宽,,,,一个万亿规模的市场容得下更多的创业公司投身其中。。。。作为其中的一家创业公司,,公司凭借全球知名的“会说话的汤姆猫”IP形象,,在全球范围内拥有250亿的下载,,,积累了庞大的粉丝用户,,,持续活跃10余年,,,,天然具备用户认知度和亲和力。。汤姆猫AI机器人通过IP人设强化情感连接,,,实现从会说话到会聊天的天然过渡,,,,形成与大厂标准化产品的区隔。。。。”
在构建护城河方面,,,公司特别强调“云端一体”能力。。。例如在本地设备端优化音频处理算法,,实现AEC(回声消除)、、AGC(自动增益控制)和ANC(主动降噪);在云端中间件系统中,,,,构建用户画像、、、关系图谱、、、、长期记忆系统、、、、情绪识别、、、TTS独特音色,,,,实现“越聊越懂你”的智能交互体验。。。
回顾整个转型路径,,,,朱志刚表示:“技术上确实经历了很多挑战,,但我们最终迎来了人工智能的破晓时刻。。。人工智能必将是人类科技发展史上具有划时代意义的、、、为各个领域带来颠覆性变革的成果,,,,是非凡与无法想象的。。。弱水三千,,,只取一瓢饮,,,汤姆猫公司将集中力量做好会聊天的汤姆猫,,,并以极致亲民的价格回馈客户,,,让每个人都可以享用会聊天的汤姆猫。。”