企业数据的科学

PNC金融服务公司如何利用Anaconda来实现整个公司的数据科学和机器学习能力

2018年8月29日
By 天博app下载的团队
PNC标志

作为一家对数据科学的现实实践充满热情的人工智能软件公司, 机器学习, 和预测分析, 天博app下载非常高兴听到天博app下载的客户使用天博app下载的产品以鼓舞人心和创新的方式推动他们的业务向前发展,并改变他们周围的世界.

今年早些时候,天博app下载举办了 第二届 AnacondaCON 数据科学和人工智能会议(将您的日历标记为 AnacondaCON 2019!), 在那里天博app下载看到了几个天博app下载最喜欢的客户分享他们的经验,并赞扬了Anaconda企业AI实现平台的优点. 天博app下载不会对你撒谎, 亲爱的读者们——看到他们对天博app下载的工作充满了热情,感觉非常好.

其中一个客户是PNC,一家在19个州运营的银行和金融服务公司. 数据经理安·曼切拉和数据科学家吉姆·奥格尔享受了 AnacondaCON 人群讲述了他们如何着手建立一个数据科学“能力中心”,以实现整个公司的数据科学和机器学习能力. (剧透警告:他们使用了天博app下载企业号.)

让巨蟒成为一流公民

早在2015年, PNC创建了一个新的企业数据管理团队,主要依赖于专有的数据科学平台. 根据他们的经验, 团队自己承担了说服管理层转向开源分析的责任,并使Python成为他们分析环境中的一等公民.

当时主要的争论是使用开源的Python和R来代替SAS和其他商业替代方案, 当然, 大幅降低软件成本. 但还有其他令人信服的理由支持他们的观点.

该团队发现,Python允许更容易的调试, 减少开发时间, 和改进的性能. 近年来巨蟒的爆炸式增长意味着有了更大的人才库来招募新人才, 强大的用户基础,提供在线社区支持, 方便, 便宜的培训. 此外, Python和R包括一个巨大的库集合——用于从机器学习到可视化的一切——这些库支持完整的分析生命周期.

选择天博app下载企业作为PNC的AI实现平台

下一个, 团队需要选择一个能够支持他们开源抱负的AI平台, 同时提供企业IT所需的安全性和治理. 他们与Anaconda和其他两个供应商一起开发了一个概念验证, 使用各种房地产住宅数据加载到他们的Hadoop环境中. 研究小组很快发现了这一点 天博app下载企业 为他们的分析师提供了他们想要的强大的开源工具,同时使他们能够轻松地访问Hadoop集群上的数据.

天博app下载企业的核心是Python和R中的核心AI/ML工具集合,数据科学家使用这些工具来构建模型. 这些工具是通过 天博app下载分布是世界上最流行的Python和R的开源数据科学发行版. 天博app下载分布为全球超过600万的数据科学家和开发人员带来了强大的开源软件包, 让他们可以在笔记本电脑上轻松地建立和训练模型.

该团队发现天博app下载企业是将SAS代码移植到Python的理想平台, 培训新的数据科学家, 建筑, 培训, 和部署模型, 和存储包. 因此,团队选择了天博app下载企业作为PNC的核心Python平台.

建立分析能力中心(ACC)

In 2017, 团队开始建立一个分析能力中心(ACC),在整个公司实现数据科学和机器学习能力. 行政协调会由五个主要组成部分:共同体, 培训, 帮助和支持, 增强, 和包维修. 在天博app下载企业平台上, ACC能够在企业范围内建立数据科学和机器学习能力, 使PNC内的各个部门能够访问工具, 管理包, 构建模型, 并在同一个地方接受培训. PNC的用户基础呈爆炸式增长, 整个银行的部门都急切地利用ACC提供的许多有价值的服务.

其他PNC部门很快开始利用ACC来制作预测亏损的模型, 保护银行, 并设置价格, 管理信息系统(Management Information Systems)小组也开始用Python开发帮助银行运营的应用程序. 然后,市场营销部带来了他们的市场篮子和定价分析, 甚至人力资源部门也有他们想要处理并向利益相关者报告的指标. ACC肯定会将模型风险管理部门纳入麾下,以帮助影响如何发展ACC环境,并在严格的监管社区中验证其开源模型. 银行的各个部门都加入了进来.

改进传统建模方法

天博app, ACC现在正在执行人们期望从银行获得的所有建模活动, 包括机器学习模型, 违约概率, 给定违约损失, 暴露在默认, 率/价格预测, 计分卡, 和PPNR.

他们甚至能够改进传统的蒙特卡罗方法, 在银行应用程序中经常使用哪些. ACC首先对单个输入集执行确定性计算, 将它们发送到Hadoop集群并让它们运行, 然后汇总结果. 他们从历史损失中获取事件级数据, 并通过传统的蒙特卡罗技术建立了总损失分布. 该团队注意到影响性能的两个因素是模拟的数量和数据集的大小. 所以他们在PySpark中实现了模拟, 并通过改变这两个因素来比较他们的PySpark实现和现有的SAS实现.

他们的分析表明了这一点, 使用Python和Hadoop, 它们可以将运行时间从几小时缩短到几分钟, 让他们的数据科学家更快更有效率.

展望未来

PNC的团队正期待着迁移到天博app下载企业 5.2. 根据安, ACC对平台的简单性感到特别兴奋, 一键部署, 因为如果一个模型不能部署到生产环境中,那么它还有什么用呢? 天博app下载企业可以方便地安排或实时部署笔记本, 指示板, 机器学习模型, 只需单击一个按钮,就可以将任何项目发布到生产环境中.

作为一家跨越多个州的银行, PNC还需要能够与其他用户协作和共享,同时确保安全性和治理. 开发人员需要能够在集中的代码基础上一起工作, 但是在不同的地方. 根据安和吉姆的说法, 天博app下载在这方面发挥了巨大的作用, ACC预计会迁移到天博app下载5号.2会让事情变得更简单.

在Anaconda,天博app下载很高兴听到PNC在整个公司提供数据科学和机器学习能力的过程, 迫不及待地想知道接下来会发生什么! 如果您想了解更多关于天博app下载企业能为您的组织做些什么, 天博app下载建议您观看天博app下载最近的网络研讨会, 大规模部署人工智能, or 天博app下载 随时安排演示.

本网站使用cookie,以确保您在天博app下载的网站上获得最佳体验. 隐私政策
接受