2023人工智能烧掉万亿元后,跳出盈利困境了吗弹簧线 2023人工智能烧掉万亿元后,跳出盈利困境了吗
人工智能行业2015年-2021年,合计融资超万亿元。虽然国家出台各类支持政策,但是行业依旧处在大面积亏损状态。一边是投资热潮、未来科技焦点,一边是企业亏损、从业人员焦虑。那么今天在这里给大家整理一下人工智能,我们一起看看吧!
人工智能企业为什么亏损?首先需要分析,为何相较一般软件行业,其毛利率较低。
开展一个人工智能项目,并非大家想象中从零开始搭建精密的算法模型。这样开发周期和成本均不能掌控。行业发展至今,已经形成了相对完备的模型库。业务开发人员只需抽取相关模型,用特定数据进行训练优化即可。 所以从开发阶段划分来看,人工智能项目大致可以划分为四个阶段:
1. 数据处理;
2. 模型设计及优化;
3. 模型评估及调整;
4. 实施部署。
各阶段的成本也呈现出不同特点。数据处理阶段主要为数据成本;模型设计及优化阶段主要为算法成本;最后两个阶段主要是交付成本。
(1)先看数据成本
数据处理环节内容较为庞杂,不仅包括原始数据获取或购买,还包括将数据整理成人工智能模型可识别的类型,甚至还要对数据进行裁剪、加粗等增强工作,形成适合的数据。
手上下
高质量的数据是算法模型成功的重要保障,但是数据处理并非一个技术问题。处理过程虽然简单,但往往是大量人力堆积的结果。数据标注行业,业已成为经济相对落后地区的重点发展产业。
自然语言处理(NLP)是一类让计算机理解人类语言,从而快速给出海量资料分析结果的人工智能基础技术。一个常见的NLP模型,训练数据样本量在5万-10万/标签,稍微复杂一些的模型,训练数据样本量要20万个。
文本数据标注还算简单,但是像人脸识别类模型,需要对图像数据进行标注。单个样本标注处理时间是文本数据3倍-5倍。训练一个人脸识别模型大概需要10万的样本量,数据整理标注成本较高。如果样本数据需要购买,整个数据成本要占到项目总成本的接近60%。从项目开发时间来看,数据采集、清洗、标注、增强等处理时间占到整个开发周期80%。
可惜的是,花费如此高的数据成本之后,所开发模型的通用性并不高。核心在于各场景下的数据标准很难统一。例如胡同交通和马路交通都并不一致,同样的识别模型在两个场景切换时就会产生巨大的效果差异。
而修改模型的成本不亚于重新开发一个模型。模型训练所需的数据质量要求高、通用性弱,造成了数据部分成本颇为刚性。
(2)再看算法成本
算法成本,即具体应用模型的设计及开发所产生的支出,主要体现在工程师的人力成本和模型训练所必须的硬件投入。
一般来看,一个市场定价在5万-10万元的常用算法模型项目,开发时间约为100小时,需要1个-2个算法工程师。单个算法工程师单月产能为8万-10万元。按照常用模型平均复用率3次(即同一个模型可以销售3次)来估算,其单月创收为20万-30万元。然而算法工程师当前薪酬5万-8万元/月,人力成本不可谓不高。这也难怪一些人工智能公司常常抱怨招不起人。
而且值得说明的是,人工智能当前依旧处在高速成长期,算法人才供不应求,用工成本不会大幅下降。
模型训练所需要硬件投入,相对数据、人力成本占比较低。而且作为固定资产,其复用率也高。其投入主要就是CPU和GPU。一块性能中等的CPU市场均价3000元左右,一般市场定价在5万-10万元的常用算力模型,大概需要4块-6块CPU。这方面投入额不到2万元,且各个项目通用性高,成本平摊之后相对较低。局域表面等离子体共振
(3)最后看看交付成本
交付成本指的是在模型验收和实施部署阶段,不能一次性成功交付,需要反复调整而产生的支出。当前国内一般项目一次性通过率不足60%。如果无法一次性成功交付,往往意味着需要补充数据和算法人员,甚至需要二次开发。这无疑会增加项目成本。
干涉光刻
综合来看,一般人工智能项目的成本构成如下:数据成本占到60%,人力成本20%,硬件及后续调整20%。在各项成本中,人力成本因为供不应求及市场竞争原因,短期内不存在下降的可能。只要人工智能深度学习底层框架不变,数据成本就呈现绝对刚性。整体来看,成本可下降的空间有限。
压花牛皮收入端:单价难提,复用有限
既然成本端支出刚性,那么收入是否会有所改观,从而提升毛利率呢?从项目收入角度看,提高毛利率无非两条路径,一是提高项目单价。这除了和人工智能项目定价机制有关,也和采购客户自身预算约束相关;二是提高项目模型的复用率。即针对某一项目开发的模型,尽可能的多卖几家,摊薄模型开发成本。
项目单价方面。人工智能企业单一项目的报价方式普遍采用“成本加成”模式,一般在名义
成本上加成20%-30%。实际上企业会虚报一点成本,这样毛利率就可以增加些许。但是在现实中,由于现阶段人工智能技术远没有达到高效替代人工的作用,采购客户往往是尝试性的消费。该种模式下,客户不接受人工智能企业过高的成本加成比例。这导致单价提升困难。
模型复用率方面。从人工智能公司客户分类的角度看,大致可以分为政府客户和一般企业客户。
电子优惠券
政府项目完全基于特定算法模型,定制化程度高,基本不复用。该类项目受政府预算影响,并非商业化主流。企业客户才是人工智能规模化商用的目标,也是新技术助力传统产业升级的价值体现。
针对企业客户,人工智能企业的商业模式是,针对各类高度细分场景,开发通用型的算法模型,提供单次数据服务或者运营报告。
这类模式下,单次服务的市场报价一般保持在模型开发成本的15%-30%。如果企业项目毛利率要达到软件行业平均的50%-60%,算法模型复用率要达到6次-10次,且每次复用模型的二次开发或者调整成本较低。
如此高的复用率就要求模型所针对的细分行业内人工智能应用较为普遍,这类细分行业一般具备以下特点:
1. 主要为简单重复性工作;
2. 场景标准化程度高,数据差异小;
3. 依靠大量人力。
同时具备这三类特征的细分行业主要集中在工业生产领域。而且,具备高度自动化物理设备的环境,才能充分展现人工智能的价值。然而当前工业自动化水平不高,单独的人工智能技术难以施展威力。
能够具备以上三个特点的上游行业通常存在很强的规模效应,行业规模相对集中。例如视频监控领域。大规模视频监控产生了大量标准化的图像识别需求,过往需要大量人力进行筛查,人工智能的出现能够大幅提高效率。