华体会体育平台是一家专注于体育娱乐的领先平台。华体会专注体育竞技,华体会app提供实时体育赛事、华体会棋牌、华体会彩票、华体会百家乐、华体会APP,华体会官网,华体会官方网站,华体会网址,华体会登陆链接,华体会平台,华体会官方平台,华体会app下载,华体会体育靠谱吗,华体会2025最新,华体会世界杯,华体会体育打造安全便捷的互动娱乐平台,体验最好的赛事服务。在人工智能技术飞速发展的今天,语料数据作为大模型训练的“基石”,其重要性愈发凸显。深耕人工智能语料生产领域20年的海天瑞声,近年来将目光投向广西,以东盟语料库建设为切入点,与当地展开深度合作。近日,北京海天瑞声科技股份有限公司首席专家王淳受邀前来南宁参加2025AI赋能千行百业超级联赛启动仪式,广西云-广西日报AI体验官与其交流时,得以窥见海天瑞声在东盟语料领域的布局、对广西AI产业的赋能,以及对行业未来的思考。
广西在东盟语料库建设中,有着独特的优势。王淳解释,语料生产中有一种关键类型叫“平行语料”,即两种语言的对应文本或语音。这需要精准的翻译与转化能力。而广西作为汉语使用地区,同时与东盟地缘相近、文化交流频繁,拥有大量熟悉东盟语言与汉语的人才,为平行语料生产提供了坚实的人力支撑。此外,广西“北上广研发+广西集成+东盟应用”的战略布局,让本地拥有丰富的生产资源和合作伙伴,能快速响应语料生产需求,这也是海天瑞声选择在广西深耕的重要原因。
从行业视角看,东盟语料库建设对国内人工智能数据服务行业意义重大。王淳表示,近年来国内大量企业在训练文本、语音大模型时,对 “东盟语言+汉语”的平行语料需求激增。而从老挝、泰国等东盟国家采集、加工的语料,正是这些企业的 “刚需”,“无论是大模型的多语言交互功能,还是跨境场景的AI应用,都离不开这些语料的支撑。可以说,东盟语料库的建设不仅填补了相关语种数据的空白,更能推动国内AI企业在跨境服务、国际合作中形成技术优势。”