中新网安徽新闻4月28日电 4月13日,日本大阪・关西世博会正式启幕,中国馆内的“AI孙悟空”展项备受瞩目。
技术赋能文化 让经典IP焕新光彩
“俺老孙来也!”当这熟悉的声音响起,AI孙悟空以腾云驾雾之姿跃然眼前。科大讯飞联合上海美术电影制片厂经典IP《大闹天宫》共同打造的“数字大圣”,将传统二维动画形象通过三维建模、唇形预测、多情感超拟人语音合成等AI核心技术进行3D重塑。

AI孙悟空并非简单的技术堆砌,这背后整合了科大讯飞在大模型方面的多项技术创新与实践。作为大阪世博会中国馆“唯一大模型展项”,科大讯飞以全国产自主可控的星火大模型为基础,融合了星火多语种大模型、星火语音大模型、多模态等多项技术能力,打造了中国家喻户晓的名著角色孙悟空的虚拟形象,高度还原的合成声音能以中、日、英三种语言与观众展开自由深度的交互,为观众带来沉浸式文化体验。
讯飞星火大模型具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态等七大核心能力,赋予虚拟形象“孙悟空”卓越的认知能力,机智的“孙悟空”能够面对面与用户亲切交流、幽默解疑,即时响应问答互动,进行精确无误的导览服务。
无论是为游客精准指引展馆路线,还是以幽默风趣的方式讲解历史文化,AI孙悟空都能与观众进行即时互动,让文化以一种鲜活、生动的方式呈现,极大地增强了文化感染力与传播力,吸引了全球观众的目光,为传统文化的传承与发展开辟了新的路径。
多语言交互 打破文化传播壁垒
在大阪世博会上,如何跨越语言进行文化传播?AI孙悟空凭借其多语言交互能力轻松突破这一壁垒。它能够实现中、日、英三语实时互动,这得益于讯飞星火多语种大模型的有力支撑。该模型目前已支持除中英外的8个语种,包含日语、阿拉伯语、俄语、西班牙语、法语、葡萄牙语、德语及韩语。

在多语种及智能语音技术方面,科大讯飞作为牵头单位的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖,这是深度学习引发全球人工智能浪潮以来,过去十年AI领域的首个国家科学技术进步奖一等奖。该项目中的相关技术创新,为之后讯飞星火大模型、多语种大模型、语音大模型的技术研发和上线奠定了重要基础。
这一技术优势不仅让不同母语的游客都能沉浸式体验中国文化,更降低了文化传播的门槛,使文化能够跨越地域、语言的限制,更广泛地传播与交流。同时,科大讯飞还为大阪世博会中国馆导览耳机提供语音技术支持,集成领先的多语种语音合成技术,满足了参观者对多种男声、女声音色及语言实时切换的个性化需求,为全球游客提供了更便捷、精准的文化讲解服务,进一步推动了文化的国际传播与交流。
科大讯飞的多语言交互技术还在更多国际场合发挥了重要作用。作为北京 2022 年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商、2023年成都第 31 届世界大学生夏季运动会自动语音转换与翻译类官方独家供应商以及 2023年布达佩斯世界田径锦标赛赛事供应商,科大讯飞用 AI 帮助全世界讲不同语言的人们无障碍沟通,促进了国际交流与合作,展现了中国 AI 技术在文化交流中的独特魅力和价值。
技术普惠民生 助力教育公平与医疗提升
自成立大模型专项研发攻关小组伊始,科大讯飞便确立了“1+N”体系。其中,“1”是指通用底座大模型;“N”是指大模型在教育、医疗、金融、汽车、运营商、工业等各个领域的落地。
2024年10月24日,基于全国首个国产万卡算力集群训练的讯飞星火4.0 Turbo正式发布,七项核心能力在中文领域全面超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o。
2025年1月,业界首个基于全国产算力平台训练的深度推理大模型——讯飞星火X1正式发布,利用更少算力实现业界一流效果;讯飞星火4.0 Turbo底座升级,行业首发混域知识搜索技术;推出业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延5秒以内,达到人类专家译员的水平。
2025年4月,讯飞星火X1迎来全新升级,在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。
基于大模型技术优势,科大讯飞的“技术向善”理念不仅体现在文化传播领域,更在教育、医疗等民生刚需领域发挥着重要作用。在教育方面,科大讯飞为全国32个省级行政区以及日本、新加坡等海外市场、5万余所学校、1.3亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教。
科大讯飞智慧教育产品通过智能分析学生的学习情况,为学生提供个性化的学习方案和辅导,帮助学生更好地掌握知识,提高学习效率,从而推动教育资源的均衡分配,为教育公平贡献力量。
在医疗领域,科大讯飞打造的智医助理产品已在全国30多个省市的670多个区县实现常态化应用,累计提供超9.1亿次AI辅诊建议,规范病历超3.5亿次,累计识别不合理处方数8600万份,辅助诊断合理率已由 2021年的约90%提高至目前的约95%。该系统有效提升了医疗服务的质量和效率,尤其在基层医疗资源相对匮乏的地区,发挥了重要作用,让更多的患者能够享受到优质的医疗服务,助力医疗水平的提升。
构建AI生态 推动千行百业数字化转型
科大讯飞积极推动AI技术与千行百业的深度融合,构建了繁荣的AI生态。在工业领域,为全国10个省20多个地市提供基于工业感知、工业认知、工业大模型、能源大模型等工业AI技术的产品和解决方案,在高端装备制造业、能源行业等场景陆续打造行业示范应用,助力工业企业实现智能化升级,提高生产效率、降低成本、提升产品质量。
在智能汽车领域,与众多车企深度合作,提供智能语音解决方案,让驾驶更安全、便捷,同时也推动了汽车产业的智能化发展。在汽车出海方面,中国汽车出海前10强企业中有8家和科大讯飞进行深度合作,讯飞座舱智能语音解决方案已帮助上百种车型出海60余个国家和地区,覆盖全球23种外语。
科大讯飞积极践行企业社会责任,探索具有高科技企业特色的“AI公益与社会责任”之路,通过开展各类公益活动,如利用AI技术助力残疾人康复、为偏远地区提供教育资源支持等,让AI技术更好地服务社会、造福人类,展现了科技企业的责任与担当。
从大阪世博会的“AI孙悟空”到教育、医疗、工业、汽车等众多领域的广泛应用,科大讯飞以“技术向善”为逻辑,充分发挥其AI技术优势,不仅让传统文化在新时代绽放光彩,更在满足人民对美好生活的向往、推动社会进步、促进行业发展等方面做出了重要贡献,生动诠释了“用人工智能建设美好世界”的企业使命,也为AI技术的未来发展提供了有益的借鉴与启示。(完)
责任编辑:张俊