2024年10月18日,数据堂创始人、CEO齐红威应邀做客MBA“领域大数据”系列讲座,为同学们讲授“人工智能数据要素建设与服务”。讲座由MBA中心主任许健教授主持。
许健主持讲座
讲座现场
本次讲座主要围绕什么是智能数据要素、智能数据产业的发展概况、智能数据的应用场景、智能数据生产与处理、联邦数据与联邦智能、人工智能技术评测解决方案、大模型数据需求的痛点及解决方案、数据二十条关键点的解读等方面进行深入探讨。讲座深刻阐述了数据在人工智能时代的重要性,让同学们对人工智能数据要素有了全面的认识。
齐红威展开讲座
讲座伊始,通过对元宇宙、数字经济、大模型等概念的讲解以及数据要素案例展示,齐红威表示,数字经济的本质其实是几乎所有产业的智能化转型升级。智能数据不仅超越了传统的结构化数据,更是驱动数字经济发展的核心动力。
在谈及智能数据产业的发展时,齐红威介绍了产业的发展演变过程。他表示,数字经济是全球趋势,也是国家发展的战略方向。产业智能化提升或转型升级为应用目标,几乎涵盖了社会的方方面面。数据要素是业务场景数据,多为图像、语音、视频等非结构化数据,涵盖面广,处理难度高,需要人工智能技术智能处理识别判断。通过数据分布式的模式来进行数据服务,从而达到对元数据的保护及合理调用。讲座中,齐红威分享了智能数据在各个应用场景中的具体案例,涵盖自动驾驶、智能客服等领域,展示了数据在数字经济转型中的重要贡献。
“从第一轮大数据的应用(如征信、风控、营销等)到第二轮数字经济的崛起,数据流动所带来的安全和隐私问题也日益突出,亟需解决。”齐红威强调,数据生产与处理的过程,尤其是数据的采集、自动标注和质量控制,对提升大模型的精准性至关重要。而随着大模型时代的到来,高质量无监督数据的积累直接影响模型的表现,如OCR识别、图表解析和格式转换,以及数据质量的差异,这对大模型的训练效果有很大影响。齐红威还介绍了评测在人工智能项目中的重要性,认为需要专业评测来检验相关技术。
最后,齐红威针对大模型的通用性和领域化应用的差距,提出了将通用模型私有化和领域定制的观点,为创业机会点进行了阐述。在互动环节,齐红威建议同学们,要抓住人工智能时代通用模型私有化和领域定制的创业机会,为数字中国建设贡献力量。
学生提问
(文、图/李硕)