Fun-ASR 是通义实验室推出的一款端到端语音识别大模型。它基于数千万小时的真实语音数据训练而成,具备强大的上下文理解能力和行业适应性。支持低延迟实时转写,覆盖31种语言。在教育、金融等垂直领域表现出色,能够精准识别专业术语和行业表达,有效解决“幻觉”生成和语言混淆等问题,实现“听得清、懂得意、写得准”。
模型名称 任务详情 训练数据 参数量
Fun-ASR-Nano
(⭐
模型名称 任务详情 训练数据 参数量
Fun-ASR-Nano
(⭐



