基于技术创新，Soul张璐率团队构建更自然的人机对话模式

2025-08-05 09:14:10　来源: 　阅读量：次

摘要：社交不仅是信息的交流，更是情绪价值的传递。正因如此，Soul张璐带领团队持续通过技术和产品设计创新提升用户体验，致力于打造更智能、更沉浸的社交环境。近日，Soul App宣布其自研端到端全双工语音通话大模型全面升

社交不仅是信息的交流，更是情绪价值的传递。正因如此，Soul张璐带领团队持续通过技术和产品设计创新提升用户体验，致力于打造更智能、更沉浸的社交环境。近日，Soul App宣布其自研端到端全双工语音通话大模型全面升级，标志着平台在探索深度社交互动方面迈出了关键一步。

随着新一轮人工智能浪潮的兴起，AI对话与AI陪伴类产品率先迎来爆发，成为大众接触和体验AI技术的主要入口。然而，受限于早期技术发展水平，人机对话多表现为“一问一答”式的机械交互，即用户提问、AI回应，过程相对割裂，延迟与打断等问题也影响了交互的流畅性与沉浸感。为突破这一局限，Soul张璐率团队升级了自研端到端全双工语音通话大模型，使得平台AI虚拟人能够在互动中具备灵活应对的能力，实现更具沉浸感、自然、灵动的交互体验，而不在局限于机械式的“一问一答”。升级后的Soul全双工语音通话大模型在AI能力上实现了多项重要突破。

首先，在交互方式上更加贴近真实对话场景，支持响应、倾听与打断的流式预测机制，使AI能够自主判断发言时机，实现真正意义上的端到端全双工交互。这意味着，AI不仅可以与用户同时说话，例如在辩论、吵架或合唱等复杂场景中自然融入，还能主动发起话题、适时打断或接受打断，从而营造出更自然、沉浸的交流氛围。

此外，新模型在表达方式和环境感知方面也有了显著提升。AI在语音表达上更加口语化和情绪化，具备笑、哭、生气等多种情绪特征，声音起伏更为自然，并能根据对话进程动态调整情绪状态。同时，系统还融合了语气词、结巴、口头禅、咳嗽等日常语音细节，使交互更具“真人感”。在内容层面，AI的对话风格更贴近社交语境，避免生硬的书面表达。更重要的是，基于统一文本与音频生成的自回归模型架构，AI能够综合人设、时间、环境及上下文信息进行发言，构建起具有连贯性和个性化的“数字人格”，推动人机互动向情感与信息双向交流的方向发展。目前，Soul AI团队正探索全双工语音通话模型在多人场景的扩展，例如在多人语音对话中，AI凭借自主决策能力，判断说话时机，有效组织话题讨论与延伸，融入真实关系生态。

此次全双工语音通话大模型的升级，显著增强了AI在互动中的在场感与情感表达能力，使人机交流更加自然和真实。Soul张璐将率队持续探索前沿技术并坚定投入应用创新，为用户提供更丰富的情感支持和多样化的互动体验，切实提升用户的归属感与幸福感。

分享到：QQ空间新浪微博腾讯微博人人网微信