社交不仅是信息的交流,更是情绪价值的传递。正因如此,Soul张璐带领团队持续通过技术和产品设计创新提升用户体验,致力于打造更智能、更沉浸的社交环境。近日,Soul App宣布其自研端到端全双工语音通话大模型全面升级,标志着平台在探索深度社交互动方面迈出了关键一步。
随着新一轮人工智能浪潮的兴起,AI对话与AI陪伴类产品率先迎来爆发,成为大众接触和体验AI技术的主要入口。然而,受限于早期技术发展水平,人机对话多表现为“一问一答”式的机械交互,即用户提问、AI回应,过程相对割裂,延迟与打断等问题也影响了交互的流畅性与沉浸感。为突破这一局限,Soul张璐率团队升级了自研端到端全双工语音通话大模型,使得平台AI虚拟人能够在互动中具备灵活应对的能力,实现更具沉浸感、自然、灵动的交互体验,而不在局限于机械式的“一问一答”。升级后的Soul全双工语音通话大模型在AI能力上实现了多项重要突破。
首先,在交互方式上更加贴近真实对话场景,支持响应、倾听与打断的流式预测机制,使AI能够自主判断发言时机,实现真正意义上的端到端全双工交互。这意味着,AI不仅可以与用户同时说话,例如在辩论、吵架或合唱等复杂场景中自然融入,还能主动发起话题、适时打断或接受打断,从而营造出更自然、沉浸的交流氛围。
此外,新模型在表达方式和环境感知方面也有了显著提升。AI在语音表达上更加口语化和情绪化,具备笑、哭、生气等多种情绪特征,声音起伏更为自然,并能根据对话进程动态调整情绪状态。同时,系统还融合了语气词、结巴、口头禅、咳嗽等日常语音细节,使交互更具“真人感”。在内容层面,AI的对话风格更贴近社交语境,避免生硬的书面表达。更重要的是,基于统一文本与音频生成的自回归模型架构,AI能够综合人设、时间、环境及上下文信息进行发言,构建起具有连贯性和个性化的“数字人格”,推动人机互动向情感与信息双向交流的方向发展。目前,Soul AI团队正探索全双工语音通话模型在多人场景的扩展,例如在多人语音对话中,AI凭借自主决策能力,判断说话时机,有效组织话题讨论与延伸,融入真实关系生态。
此次全双工语音通话大模型的升级,显著增强了AI在互动中的在场感与情感表达能力,使人机交流更加自然和真实。Soul张璐将率队持续探索前沿技术并坚定投入应用创新,为用户提供更丰富的情感支持和多样化的互动体验,切实提升用户的归属感与幸福感。