使用人工数据存储库驱动您的数据流管道到生产

在过去的十年里,出现了巨大的数据爆炸。大多数公司使用几个月、几周甚至几天收集的分析数据来进行业务决策,并且可以逐分钟响应变化。为了进行实时分析和数据挖掘,数据科学家、数据分析师和软件开发人员使用Conda,作为他们管理包的开源、跨平台工具。
JFrog已经扩大了它的通用存储库管理提供支持Conda存储库,从6.3版开始提供,提供Python, R, Ruby, Lua, Scala, Java, JavaScript, C/ c++, FORTRAN开发人员使用JFrog Artifactory的所有好处。这包括Conda包的可伸缩性、安全性和可见性。
结合最近的凹口库版本中,JFrog为Conda包存储库提供了人工支持用户完全控制其包的部署和解析过程。

在这篇博文中,我们将强调使用的六个原因Artifactory中的Conda存储库以及它们是如何设计来解决数据科学家面临的主要DevOps挑战的。
在Artifactory中使用Conda存储库的6个原因
原因1:保护您的数据科学工件
获得具有细粒度访问控制的安全和私有本地Conda存储库。Artifactory允许您使用本地存储库托管内部源代码和二进制文件,这样您就可以在组织内部共享包。
原因2:使用版本管理
将旧版本的软件包上传到本地存储库。
原因3:远程Conda存储库中的代理外部依赖关系
通过代理远程Conda资源(如2022世界杯阿根廷预选赛赛程公共咨询登记处,并使用远程存储库在Artifactory.
这意味着您不依赖于数据中心和任何外部存储库之间的网络性能。并且您的性能不会因为外部存储库中的包的中断或更改而受到影响。
原因4:协作和共享数据模型
从单个URL访问本地托管的Conda存储库以及代理的远程Conda存储库,使用虚拟存储库.

原因5:从直观的UI或Conda客户端解决依赖关系
直接在Artifactory UI中解决依赖关系。当在Artifacts Tree Browser中选择Conda存储库时,单击帮我介绍查看可用于发布Conda包或配置Conda客户端以使用选定的存储库解析工件的代码片段。

原因6:查看Conda包元数据
直接从Artifactory UI中查看Conda包的选定元数据。Conda包的元数据计算托管在Artifactory本地存储库中。
在树浏览器,选择虚拟Conda存储库,向下滚动以查找并选择要检查的包。元数据显示在Conda信息选项卡。

你自己试试,看看开始是多么容易。
