侧边栏壁纸
博主头像
MobotStone - 技术宅博主等级

行动起来,活在当下

  • 累计撰写 191 篇文章
  • 累计创建 80 个标签
  • 累计收到 1 条评论

目 录CONTENT

文章目录

人工智能项目的十条建议--概念篇

MobotStone
2022-11-16 / 0 评论 / 2 点赞 / 4935 阅读 / 3993 字

人工智能项目可以为公司带来难以置信的价值,但它们的设计必须符合核心指导原则,以确保获得最大回报。

人工智能项目的十条建议——概念篇

介绍

随着各行各业希望通过提高自动化来改善工作流程,以及产品和服务的交付,对采用更先进的人工智能能力和项目的需求不断增长。

当然,只有在合适的前提下,深度学习和机器学习可以带来巨大的价值回报。在任何情况下,无论是从业务角度还是技术角度,人工智能项目都必须经历一些问题。为了让以后AI项目少踩坑,根据以往经验,我总结了“十条建议”,分为两篇:概念篇,指导篇,下文是概念篇的内容。

人工智能项目的十条建议——概念篇

1. 定义问题–理解问题

在处理人工智能问题时,必须以最完整的术语定义问题。在项目开始时需要预留出时间。记录要解决的问题是什么,哪些数据可供您使用,以及需要什么样的解决方案。与最终用户重要问题陈述,以确保提供正确的解决方案。

在定义问题时,让问题变得具体才是关键。以欺诈检测模型为例。与其将问题定义为“减少欺诈”,后者设置了广泛的参数并且没有明确的起点和终点,而是更具体地指导您正确有效地解决问题。例如,将问题描述为“在付款完成之前标记信用卡购买的潜在欺诈交易并提醒客户”,这提供了有关需要预测什么、需要采取哪些行动以及适当的时间框架的信息。

2.不要根据你想要的方案来制造问题

从第一条开始。在不了解数据和问题陈述的情况下说“我想使用神经网络解决这个问题”,甚至说“我们将使用机器学习来解决这个问题”是很危险的。并非所有问题都需要机器学习,有些基于规则的方法通常就足够了,甚至更胜一筹。同样,并非所有机器学习问题都适合神经网络。有很多算法,每种算法都擅长做不同的事情。让解决方案来自问题——而不是相反。

这再次归结为仔细定义。不要跳到解决方案。例如,避免将您的解决方案定义为“我想使用深度学习来解决潜在的欺诈交易”。相反,请用更简单的术语来构建您的解决方案,例如“我想标记潜在的欺诈性交易”。

3.确保问题能够得到解决

明白定义问题和获取数据并不意味着问题可以得到解决。想想当前的解决方案,你有什么样的数据,以及想要的结果。在给定无限时间的情况下,人类能否使用相同的数据来解决这个问题?如果不是,则很可能无法使用机器学习来解决问题。如有疑问,请咨询同事。

在金融界,账户余额预测是一种经常被要求的解决方案,但没有人或电脑能告诉你未来几个月你的财务状况会怎样。想想大流行何时来袭;数百万人意外失去了工作。当房屋被盗并且需要更换物品时该怎么办?这些是人类和算法都无法预测的事情。

4.了解你的目标用户

任何问题的最终目标都是通过提供适当的解决方案来满足最终用户的需求。通过了解目标用户当前拥有什么、缺乏什么以及他们未来需要什么,您可以从一开始就瞄准最佳解决方案。用户想要聚合预测、分布还是单独的预测?他们希望如何呈现数据?API 可能更适合技术人员,但可视化仪表板更适合PM或管理人员的。一旦解决方案完成,这些思路可以减少繁琐的格式化,因此必须提前考虑。

5. 拥有与问题相关的良好数据

垃圾进垃圾出。这是AI行业流行的格言。不管有多少数据,如果不好,就无法进行数据分析。数据必须与问题相关,并且有足够量的有效记录。

如果任务需要数据标签而没有数据标签,则分类算法将无法工作。如果数据的结构不一致,那么未来的pipe将无法工作。不要仅仅为了有而建立一个垃圾模型。

6.有一个业务专家支持

如果不了解问题和数据,您将不可避免地犯下非常可避免的错误。

通过聘请业务专家,您可以提出有关数据的问题(例如,“当该字段为空时,这意味着什么?”)和问题(例如,“考虑此功能是否有意义?”)。通过与他们一起检查,您可以确保您的产品确实是一个可靠的解决方案。

人工智能项目的十条建议——概念篇

7.注意你的预测和业务进度限制

业务目标几乎总是遵循进度表,因此请考虑模型的训练和预测允许多少时间和计算能力。有些情况需要立即进行预测,而其他情况可以在闲暇时分批完成。您可能有可用的大型计算集群,或者可能必须使用很少的内存快速训练模型。训练一个超级复杂的神经网络有可能并不是业务真正想要的

8. 预先了解存在哪些法律限制

在金融等受监管的行业中,可以使用哪些信息以及模型必须有多透明是有限制的。提前知道哪些数据可以自由使用。如果您想要的字段受到限制,请找出是否可以以某种方式对其进行存储或匿名化。同样重要的是,哪些机器学习模型可以用于任务,而不会影响监管标准。例如,决策树通常被认为是非常透明的,而神经网络则不是。为了满足法律要求,通常需要轻微的性能下降。

9. 了解部署方法

了解如何部署解决方案可以帮助您简化开发过程。需要考虑的几件事是数据格式、模型存储位置、时间和维护。这是托管模型吗?是否有您必须遵循标准公司流程?在设计的早期阶段意识到这些将节省大量时间和工作。

10. 不要重新发明轮子

也许,最重要的是,不要只花时间复制当前的解决方案。如果存在解决方案,请使用它。利用您的时间和计算能力来迭代和改进可用的方案,形成通用的工具,满足其他不同需求的业务使用

结论

所以你理解了这十条建议,可以为您的人工智能项目做好准备。无论您是在大型公司还是创业公司,都不要紧,遵循这些核心原则,您将永远不会偏离目标。

2