首先感谢大吧主的点赞,这种认可也是我想继续这样去帮助新人的一种动力,我个人认为任何一个行业都需要仔细的研究与探索,而并不是闷头苦干,很多人一开口数据标注就是拉框就是画线打标签,并没有深层次了解过这个行业,也并不知道这个行业来自哪里,更不知道这个行业何去何从。
首先是世界人工智能重大事件时间表,了解人工智能的发展,才能得知我们这个行业的开端。
1943年心理学家McCulloch和逻辑学家Pitts合作提出神经元模型。
1949年信息论奠基人Claude Shannon提出一篇名为“Programming a Computer for Playing Chess”的论文,探讨机器下棋的可能性。
1950年由计算机先駆艾伦·图灵提出图灵测试,图灵测试成为衡量机器智能的标准。
1956年达特茅斯會议召开,标志着人工智能领域正式诞生。
1958年John McCarthy创建了“人工智能”Artificial Intelligence这个词汇,定义了人工智能的范畴。
1965年由Joseph Weizenbaum教授开发左世界上第一个智能聊天机器人ELIZA。
1969年Shakey机器人问世,这个机器人被认为是第一个真正意义上的移动机器人。
1974年AI语言LISP问世,它成为左人工智能研究的一种标准编程语言。
1980年模糊逻辑理论问世,提出左一种新的描述不确定性问题的方法。
1986年反向传播算法提出,解决了神经网络的学习问题。
1997年IBM的深蓝超级计算机击败国际象棋世界冠军加里·卡斯帕罗夫。
2002年iRobot公司嘅Roomba家用机器人问世,成为普及家庭机器人的开端。
2005年斯坦福大学计算机科学系和Google合作,启动Google街景项目。
2011年IBM的人工智能计算机Watson击败Jeopardy!游戏节目的人类冠军。
2012年AlexNet网络问世,深度学习取得突破。
2014年Google收购DeepMind公司,深度学习技术开始广泛应用。
2016年AlphaGo击败围棋世界冠军李世石。
2017年Google Brain团队论文《Attention is all you need 》提出Transformer架构。
2018年OpenAI推出左GPT模型,该模型在语言模型、翻译等领域取得了突破。
2019年AlphaStar击败星际争霸II职业玩家。
2020年GPT-3问世,2021年GPT-3广泛应用于各个领域,ChatGPT聊天机器人被开放使用。
而在我所知的人工智能培训师,最早的标注工作开始于2017年,也是第一批进入并开始进行数据标注服务,只是在当时没有一个明确的名称。而在2018年在山西太原落户第一家数据标注基地。AI人工智能的数据标注从幕后走向台前。
先来了解一下数据标注在人工智能产业链中的位置:
人工智能产业链可以分为“应用层”“技术层”和“数据层”。一个不太恰当的类比可以帮助大家粗略理解三者的关系——应用层相当于汽车,技术层是汽车的引擎发动机,数据层则是汽油。
正如汽油需要从原油中提炼才能供汽车使用一样,AI产业链条中,大多数据为非结构化数据,AI公司通过数据标注获得结构化数据,以此“喂养”算法进行AI训练,最终生成的模型数据可用于各种场景,从而激发数据的AI价值。
2020年,“人工智能训练师”正式成为新职业被纳入国家职业分类目录。
目前,人工智能逐渐渗入智慧城市、智能制造、自动驾驶、智能服务、智能医疗、智能农业、智能物流、智能金融等社会生产生活的各个角落,也由此带动了数据服务市场的爆发。
据IDC中国2021年《中国人工智能基础数据服务市场研究报告》预测,2025年市场规模将突破120亿元,2020-2025年复合增长率为47%。
在数据层面,相比看不见摸不着的数据,主机厂更容易对精巧玲珑的机械构造心动。这便导致主机厂的数据积累还很早期,而自动驾驶时代的到来,让主机厂必须开始重视数据积累,未来各家要求的数据类型,数据格式,数据标注的方法,都会随着数据量的提升不断迭代。
在算力层面,高端AI芯片的短缺问题仍未见曙光;在人才层面,主机厂对感知、规划、决策、控制,各方面算法的人才,都需要进行全面储备。
因此,现在正处于数据标注行业抬头的时期,可以预见,往后的市场空间还有进一步上升的可能。
据智研咨询数据,2015~2021年,我国数据标注与审核行业市场规模保持稳步增长态势,2021年达到44.40亿元,到2028年,我国数据标注与审核行业市场规模预计将达262.74亿元。
在巨大的市场空间面前,嗅觉敏锐的人早早入场。和大多数行业一样,数据标注产业的发展也经历了一段从蛮荒到有序的过渡时期。
2021年大批嗅到先机的年轻人、创业者涌向数据标注,也迎来了数据标注空前火热的局面,而在此时也出现了一个大家常常挂在嘴边的词语“割韭菜”。就我所知,有些公司并未全力拓展标注部,而是重金打造商务部,加盟费用甚至高达69800元。而公司坐落于万达等知名高档写字楼,从各地奔赴的创业者,络绎不绝。光是年底年会花费超200万元。
任何的行业发展都会从野蛮生长到大浪淘沙。2022年的数据波动大,导致很多公司转行停业,那些老板大多无非经历的是被割韭菜或者结算拖延、数据不稳定。对于这个行业带来巨大贬义,甚至一提数据标注就是割韭菜的代名词。可是在你家楼下为什么同一条街上的饭馆有的生意火爆有的却是贴着转让告示呢?而经过这一年,平台承揽项目,向下外放的时代也已在悄悄松动,而那些在21年以百人站立的成熟团队在22年土崩瓦解,更多的都是被10-30人的团队所替代。
2023年在我个人看来数据标注已经将行业内的公司清洗了一遍,大多公司都被淘汰,而那些存活的无非就是三种,1、割韭菜割的多,换个方式换个壳继续割,只是没有以前那样高的利润。2、技术过硬、渠道过硬,已发展出成熟的运营模式。3、现在才听说这个行业,准备入坑,或刚刚入坑的工作室、公司。但在我个人看来这并不是一件坏事,而更像是一种资源整合,把行业水平推向另外一个高度,把门槛提高,彻底脱离那个群魔乱舞的时代。
首先是世界人工智能重大事件时间表,了解人工智能的发展,才能得知我们这个行业的开端。
1943年心理学家McCulloch和逻辑学家Pitts合作提出神经元模型。
1949年信息论奠基人Claude Shannon提出一篇名为“Programming a Computer for Playing Chess”的论文,探讨机器下棋的可能性。
1950年由计算机先駆艾伦·图灵提出图灵测试,图灵测试成为衡量机器智能的标准。
1956年达特茅斯會议召开,标志着人工智能领域正式诞生。
1958年John McCarthy创建了“人工智能”Artificial Intelligence这个词汇,定义了人工智能的范畴。
1965年由Joseph Weizenbaum教授开发左世界上第一个智能聊天机器人ELIZA。
1969年Shakey机器人问世,这个机器人被认为是第一个真正意义上的移动机器人。
1974年AI语言LISP问世,它成为左人工智能研究的一种标准编程语言。
1980年模糊逻辑理论问世,提出左一种新的描述不确定性问题的方法。
1986年反向传播算法提出,解决了神经网络的学习问题。
1997年IBM的深蓝超级计算机击败国际象棋世界冠军加里·卡斯帕罗夫。
2002年iRobot公司嘅Roomba家用机器人问世,成为普及家庭机器人的开端。
2005年斯坦福大学计算机科学系和Google合作,启动Google街景项目。
2011年IBM的人工智能计算机Watson击败Jeopardy!游戏节目的人类冠军。
2012年AlexNet网络问世,深度学习取得突破。
2014年Google收购DeepMind公司,深度学习技术开始广泛应用。
2016年AlphaGo击败围棋世界冠军李世石。
2017年Google Brain团队论文《Attention is all you need 》提出Transformer架构。
2018年OpenAI推出左GPT模型,该模型在语言模型、翻译等领域取得了突破。
2019年AlphaStar击败星际争霸II职业玩家。
2020年GPT-3问世,2021年GPT-3广泛应用于各个领域,ChatGPT聊天机器人被开放使用。
而在我所知的人工智能培训师,最早的标注工作开始于2017年,也是第一批进入并开始进行数据标注服务,只是在当时没有一个明确的名称。而在2018年在山西太原落户第一家数据标注基地。AI人工智能的数据标注从幕后走向台前。
先来了解一下数据标注在人工智能产业链中的位置:
人工智能产业链可以分为“应用层”“技术层”和“数据层”。一个不太恰当的类比可以帮助大家粗略理解三者的关系——应用层相当于汽车,技术层是汽车的引擎发动机,数据层则是汽油。
正如汽油需要从原油中提炼才能供汽车使用一样,AI产业链条中,大多数据为非结构化数据,AI公司通过数据标注获得结构化数据,以此“喂养”算法进行AI训练,最终生成的模型数据可用于各种场景,从而激发数据的AI价值。
2020年,“人工智能训练师”正式成为新职业被纳入国家职业分类目录。
目前,人工智能逐渐渗入智慧城市、智能制造、自动驾驶、智能服务、智能医疗、智能农业、智能物流、智能金融等社会生产生活的各个角落,也由此带动了数据服务市场的爆发。
据IDC中国2021年《中国人工智能基础数据服务市场研究报告》预测,2025年市场规模将突破120亿元,2020-2025年复合增长率为47%。
在数据层面,相比看不见摸不着的数据,主机厂更容易对精巧玲珑的机械构造心动。这便导致主机厂的数据积累还很早期,而自动驾驶时代的到来,让主机厂必须开始重视数据积累,未来各家要求的数据类型,数据格式,数据标注的方法,都会随着数据量的提升不断迭代。
在算力层面,高端AI芯片的短缺问题仍未见曙光;在人才层面,主机厂对感知、规划、决策、控制,各方面算法的人才,都需要进行全面储备。
因此,现在正处于数据标注行业抬头的时期,可以预见,往后的市场空间还有进一步上升的可能。
据智研咨询数据,2015~2021年,我国数据标注与审核行业市场规模保持稳步增长态势,2021年达到44.40亿元,到2028年,我国数据标注与审核行业市场规模预计将达262.74亿元。
在巨大的市场空间面前,嗅觉敏锐的人早早入场。和大多数行业一样,数据标注产业的发展也经历了一段从蛮荒到有序的过渡时期。
2021年大批嗅到先机的年轻人、创业者涌向数据标注,也迎来了数据标注空前火热的局面,而在此时也出现了一个大家常常挂在嘴边的词语“割韭菜”。就我所知,有些公司并未全力拓展标注部,而是重金打造商务部,加盟费用甚至高达69800元。而公司坐落于万达等知名高档写字楼,从各地奔赴的创业者,络绎不绝。光是年底年会花费超200万元。
任何的行业发展都会从野蛮生长到大浪淘沙。2022年的数据波动大,导致很多公司转行停业,那些老板大多无非经历的是被割韭菜或者结算拖延、数据不稳定。对于这个行业带来巨大贬义,甚至一提数据标注就是割韭菜的代名词。可是在你家楼下为什么同一条街上的饭馆有的生意火爆有的却是贴着转让告示呢?而经过这一年,平台承揽项目,向下外放的时代也已在悄悄松动,而那些在21年以百人站立的成熟团队在22年土崩瓦解,更多的都是被10-30人的团队所替代。
2023年在我个人看来数据标注已经将行业内的公司清洗了一遍,大多公司都被淘汰,而那些存活的无非就是三种,1、割韭菜割的多,换个方式换个壳继续割,只是没有以前那样高的利润。2、技术过硬、渠道过硬,已发展出成熟的运营模式。3、现在才听说这个行业,准备入坑,或刚刚入坑的工作室、公司。但在我个人看来这并不是一件坏事,而更像是一种资源整合,把行业水平推向另外一个高度,把门槛提高,彻底脱离那个群魔乱舞的时代。