时间:2022-10-28 11:31:45
作者:星辉注册科技
浏览: 次
人工智能行业的兴起,使得AI领域对数据标注的需求越来越大。例如,想要让AI能准确的识别出图片,就需要在数据集中手动将同类的图片进行标注,让算法和图像之间产生关联性的判断识别。而这一过程需要大量的图片才能让AI学习得到一个模型。数据标注是这一过程中最基础的工作,那么,什么是数据标注呢?为什么需要数据标注呢?下面我们就来介绍。
数据标注是对数据样本进行标记和检测的过程,把需要计算机进行机器学习的的图片、视频等初级数据打上标签,让计算机进行不断的识别这些初级数据的特征,最终可以让计算机能够自主的识别,为人工智能算法提供大量的训练数据以供机器学习调用。
人工智能AI的落地程度,取决于对其给予以学习、训练所使用的数据,数据的数量和质量直接决定了AI算法的成败。因此,在构建Al模型的时候就需要大量的训练数据持续流入,以丰富AI模型在未来的学习中,即出现监督学习。
随着数字图像处理和计算机平台的兴起,逐步融入到现代化数字领域,在银行、金融、社交媒体、智慧农业、数字商务等场景中发挥着关键性作用。数字内容在各业务平台上的增长,需要处理大量的图像、视频、文本等用户数据,这些都离不开数据标注的基础支撑。
数据标注有很多类型,如标框标注、分类标注、区域标注、描点标注等。基础的数据标注类型有计算机视觉、语音工程、自然语言处理。
1、计算机视觉类:拉框标注、语义分割、3D点云标注、关键点标注、线标注、2D/3D融合标注、目标跟踪、图片分类等。
2、自然语言处理类:OCR转写、文本信息抽取、NLU语句泛化、词性标注、情感判断、意图判断、机器翻译、指代消解、槽位填充等。
3、语音工程类:ASR语音转写、语音情绪判定、声纹识别标注、语音切割等。