来源:证券时报网
媒体
2025-10-10 18:13:02
(原标题:海天瑞声:布局具身智能数据需求 加码海外数据标注市场)
AI训练数据服务商海天瑞声(688787)日前举办2025年半年度业绩说明会,公司高管回应了上半年毛利率下降的原因,同时公司积极布局海外数据标注市场,以及具身智能模型训练数据需求。
定制化服务收入拖累毛利率
受益于计算机视觉、自然语言和智能语音三大业务板块全面增长,今年上半年海天瑞声实现营业收入1.57亿元,同比增长近七成,归母净利润380万元,同比增长约8倍。但报告期内公司销售毛利率为50.17%,环比进一步下降。
对于毛利率下滑的原因,海天瑞声高管表示,主要系受业务类型阶段性变化影响,定制化服务收入占比提升所致。公司新拓展的境外内容审核业务目前全部采用定制化服务模式,另外,央企客户正积极践行“AI+”战略,其行业数据需求具有高度差异化特征,因此相关业务也以定制类服务为主。
据介绍,在国家“AI+数据要素”战略的指引下,重点央企自2024年起加速布局通用+垂向大模型研发,带动了高质量图像、视频等训练数据的规模化采购需求。公司已成为中国移动重要的数据服务供应商。
展望未来,公司将在持续深耕头部客户需求的基础上,加快推进标注流程的智能化升级与标准化数据产品体系建设,不断提升项目运营效率,逐步优化毛利结构。
拓展海外市场
“海外市场空间广阔,规模为国内多倍,且随着Meta收购Scale AI,Google、微软等多家大厂开始切断与Scale AI的合作,海外AI数据服务市场格局正在重塑,这为专业数据服务商带来了新的市场机遇。” 海天瑞声董事长贺琳表示。
目前公司全面推进全球化战略布局,一方面通过并购菲律宾交付基地构建海外标注产能,重点拓展更具市场潜力的定制化服务;另一方面加快全球化服务网络建设,已在中国香港、新加坡和美国设立区域子公司,并积极推进日本、韩国及欧盟子公司落地,提升客户触达效率和需求响应速度。
从收入结构来看,海天瑞声计算机视觉和自然语言业务占比提升,分别为40%、14%,主要得益于相关领域的技术突破和市场需求增长。其中,在计算机视觉领域,受益于视觉大模型技术的快速迭代和应用场景的持续拓展,特别是图像与视频文本对等数据需求的爆发式增长,该业务板块实现强劲增长。同时,公司在东南亚的数据交付体系已稳定运营,进一步带动了视觉业务收入的提升。
在自然语言处理方面,大模型技术在政务、法律合规等专业领域的深度应用成效显著,叠加全球化扩张带来的多语言语料需求激增,共同推动了该业务的快速发展。相较而言,智能语音业务虽保持稳定增长,但增速相对平缓。因此,计算机视觉和自然语言处理这两大高增长业务在整体收入结构中的占比提升。
布局具身智能
海天瑞声也在布局具身智能市场,旨在提供核心数据支撑。
贺琳表示,2025年具身智能进入加速发展期,产业正从技术验证迈向场景应用,这对训练数据的质量、规模和场景化提出了更高要求。
据介绍,目前具身智能行业数据来源包括互联网开源数据集(整合现有的公开机器人数据)、虚拟合成(利用仿真环境生成训练数据)、动作捕捉(记录人类在特定环境中的行为模式),以及机器人遥操(通过人工远程操控获取真实场景下的操作数据)等。其中,虚拟合成技术虽解决了初期数据短缺问题,但由于“仿真差距”的存在,其数据质量往往难以满足高精度训练需求。而开源数据集则面临着数据规模有限(通常仅百万级)、采集条件单一等挑战,无法支撑复杂场景下的模型训练需求。
具身智能行业正积极探索虚实结合的数据闭环模式,通过真实遥操数据修正仿真偏差,同时结合多模态标注,持续提升数据的多样性与有效性。在此背景下,海天瑞声能够为具身智能模型训练提供支持,公司还携手石景山人形机器人数据训练中心共建“具身智能数据训练场”,致力于打造“数据采集—模型训练—场景验证”的全流程闭环,以解决行业数据瓶颈问题。此外,公司还发布了全国首个具身智能数据工程化服务平台,通过系统化、自动化的数据管理赋能开发者,提升研发效率。
另外,围绕数据要素业务,海天瑞声发挥生态优势,助力地方及产业园区打造数据标注基地和构建数据标注产业新生态。目前公司已与3个承担数据标注基地建设任务的城市——成都、长沙、保定等地方政府成立合资公司,并与内蒙古呼和浩特签署战略合作协议,聚焦当地乳业、草种、文旅等特色产业,共建高质量数据集,有效驱动当地产业的数字化转型。此外,公司正拓展与上海、广州、宜宾等十余地的战略合作,进一步完善标注基地的全国性业务布局。
证券时报网
2025-10-10
证券时报网
2025-10-10
证券时报网
2025-10-10
证券时报网
2025-10-10
证券时报
2025-10-10
证券时报
2025-10-10
证券之星资讯
2025-10-10
证券之星资讯
2025-10-10
证券之星资讯
2025-10-10