汇聚全球视觉新闻资讯
你所在的位置:汇视网 > 新闻 >财经

机器学习大牛吴恩达:调优数据比调优模型更重要

发布时间:2021-09-15 13:13  来源:东方网   编辑:许一诺  阅读量:19792   

日前,在网上举行的亚马逊云技术中国峰会上,亚马逊云技术人工智能与机器学习副总裁Swami Sivasubramanian与DeepLearning创始人吴恩达进行了交流人工智能教育公司AI,讨论机器学习的未来,下一代机器学习从业者需要掌握的基本技能,以及如何在机器学习中弥合概念证明和生产之间的差距

左边是吴恩达,右边是斯瓦米西瓦苏布拉曼。

吴恩达是人工智能教育公司DeepLearning的创始人AI,工业人工智能平台公司Landing AI的创始人兼CEO,在线学习提供商Coursera的联合创始人兼董事长吴达曾经在谷歌工作他是谷歌深度大脑学习项目的创始人和领导者,也是百度人工智能的首席科学家他还是斯坦福大学计算机科学的兼职教授,领导着一个关于人工智能,机器学习和深度学习的研究小组

现场,吴恩达分享了将机器学习从概念验证引入生产的技巧,快速赢得第一个项目以获得推进动力的重要性,以及确保负责制定和实施机器学习策略的高管接受这一技术的充分教育的建议。

我看到组织犯的第一个错误是开始或计划的时间太长首席信息官说,我的数据一团糟,我的数字筒仓需要彻底清理可是,事实上,基本上每个人的数据仓库里都有杂乱的数据,吴恩达说

吴恩达认为,启动一个小的试点项目以快速取胜非常重要几乎每家公司都有足够的数据可以启动,我发现那些直接加入进来,迅速赢得一个较小项目,并利用学到的知识伴随着时间的推移发展成越来越大的项目的公司做得更好

那么如何为机器学习项目制定关键的性能指标呢对此,吴恩达的回答是,如果你第一次从事一个项目和一个全新的应用,AI团队很难设定成功的目标作为团队正在进行的项目,很难建立一些合理的基线绩效水平我认为你只需要快速构建第一个原型系统就可以了解可能的情况

再者,很多公司起步时往往发现数据不够,数据是机器学习的燃料这个时候我们该怎么办吴恩达提出,我的典型建议是直接进入并开始使用小数据集做一些事情,然后通常收集更多的数据我发现,对于许多实际应用程序来说,保持代码修复并迭代地改进数据比以模型为中心的方法更有用这是Mops的一个新部分,我认为目前还没有人真正拥有优秀的工具

MLOps是AI领域比较新的概念,旨在保证模型输出的质量,加速机器学习模型的开发和生产部署它是数据科学家和操作专业人员之间协作和交流的实践,以帮助管理机器学习任务的生命周期MLOps基于DevOps的原理和实践,可以提高工作流效率

机器学习的进步是模型带来的还是数据带来的,一直是一个很大的争议在2021年4月18日发布的视频中,吴恩达表示,一个机器学习团队80%的工作应该放在数据准备上,保证数据质量是最重要的工作MLOps是保证数据质量的重要工具,在整个机器学习项目中是高质量和一致的吴恩达对此做了进一步解释

在实验室训练AI模型,然后发表论文并产生好的结果,这是令人兴奋的但是,当人们看机器学习项目的生命周期时,不仅需要训练模型,还需要看项目的范围,决定做什么和不做什么,收集数据并保证数据的高质量然后将其投入生产,并检查其在解决任何性能或公平性问题方面的性能因此,吴恩达认为,如果能够构建这样一个工具,就可以授权更多的人来构建,部署,维护和有效使用机器学习系统

AI系统不仅仅是代码,而是代码加数据对于代码,我们有一个DevOps规程在数据方面,为了管理项目中持续的高质量数据流,MLOps需要更多的迭代他们需要共同努力,吴恩达说

最后,对于刚毕业的工程师,吴恩达给出了自己的建议,我发现在人工智能领域最好的表现就是‘T型’人才——拥有广泛的技术知识基础,在某些领域确实涉足很深作业往往是个人获取广泛技术知识基础的一种非常有效的方式然后超越某一个点,为了获得更深入的知识,就必须跳进去做项目工作我们都想建立一个能让很多人受益的项目,创造一个巨大的经济社区也很重要我觉得我们都是被身边的人塑造的,所以找志同道合的人互相分享知识吧

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

相关搜索热词:机器