对于消费者来说,无论是假新闻还是个人信息泄露都是因为互联网大数据的原因而造成的,今天我们就一起来了解一下,人工智能在解决这些问题上都有哪些贡献。
算法VS算法。除了“假新闻”,还会有其它领域的人工智能系统受到基于人工智能的攻击
随着生成逼真的虚假图像和视频的技术不断进步,以及欺骗机器学习算法的新方法的出现(例如假新闻)——自动驾驶汽车和其他关键任务系统将面临新的安全问题。到目前为止,公众的关注主要集中在图像、视频和音频上面——泛泛地说,就是“假媒体”和“假新闻”泛滥成灾——但在2019年,我们将看到某种攻击示范:产生令人信服但虚假的结构化和非结构化文本数据,导致机器在一些问题的自动化决策上出错,比如信用评分和从文件中提取数据。
迁移学习和模拟成为主流,帮助企业克服冷启动问题和避免高企的培训数据积累成本
大多数人工智能项目的成功在很大程度上取决于是否拥有高质量的、带标记的数据。大多数项目都死在这个问题上,因为它们通常都没有关于手头问题的现成数据,又或者很难手工标记所有现有的数据。
例如,即使是像预测客户是否会购买产品这样简单的事情,在起初没有客户的时候也会遇到冷启动问题。如果你的生意一直都没能做大,那么你就永远不会得到在利用强大技术上可能必不可少的“大数据”。更糟糕的是,在需要专业知识的情况中(例如,给肿瘤贴标签),获得数千个数据标记的成本极其高昂。
人工智能研究的一个活跃领域是如何应对这种挑战。在只有少量数据的情况下,我们如何能用上强大的深度学习技术呢2019年,有两种方法将在企业内得到更多的采用。一个有效的方法是迁移学习——从一个有大量数据的领域中学习的模型被用来重新训练机器在另一个数据少得多的领域中学习。例如,LandingAI能够通过仅仅使用少数有缺陷的产品的例子来检测生产线上目标对象的缺陷。现在任何人都可以先从从像ImageNet这样的大型数据集学习了大量关于图像的知识的模型着手,训练专门的物体分类器(比如区分损坏的汽车或房屋,自动处理保险)。这些领域也不必基于相同的数据类型。研究人员使用从图像数据库学习的模型来训练分类器,获取传感器数据。
二种方法是合成数据生成和模拟。生成式对抗网络可让我们创造非常逼真的数据。众所周知,英伟达公司使用生成式对抗网络生成了虚拟但非常引人注目的名人面孔。自动驾驶汽车公司们还创建了虚拟的模拟场景,在这些场景中,它们能够在比现实生活中更大的距离上训练自己的驾驶算法。例如,Waymo无人驾驶汽车在模拟中行驶了50亿英里,在现实世界的道路上则仅仅行驶了8英里。2019年,企业将利用模拟、虚拟现实和合成数据来在机器学习上取得巨大的进展。而在以前,由于数据方面的局限性,这是不可能实现的。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。