云原生架构

DSW借助阿里云ECS,Docker和Kubernetes等云原生技能,能够在几分钟内帮用户完成环境搭建。
用户可以根据算法须要和本钱考虑,选择阿里云ECS供应的包括CPU和异构打算GPU在内的所有资源规格。

知足不同层次开拓习气

结合交互式编程和命令行输入,DSW供应了三种编程入口: WebIde适用于工程化哀求比较高的项目;JupyterLab适用于快速POC试验;Terminal入口可用于快速实行Shell命令,运行程序和大略的编辑等。

预装丰富插件

DSW还开拓和预装了各种JupyterLab和WebIDE插件,比如广受深度学习开拓者喜好的可视化工具Tensorboard,用户在DSW内通过Launcher,Commands打开,乃至还可以利用%tensorboard邪术命令直接在Notebook中开启等多种办法利用Tensorboard。
不仅支持本地文件,还可以打开存放在OSS,ODPS里的演习日志。
针对算法同学利用Python比较多的特点, DSW的WebIDE内安装了Python插件,可以直接在浏览器内在线调试,单步跟踪程序运行。
用户还可以根据须要,自主安装须要的任意插件。

支持多种数据源读写

NAS, OSS,云盘和MaxCompute,尤其是内置了dswmagic邪术命令可以让用户在ipynb文件中利用SQL语句读写MaxCompute表中数据,预置的SQL编辑器支持语法高亮、智能提示、自动补全等功能,还支持运行带变量更换功能的Sql脚本。
查询结果自动以最友好的图形化展示。

轻量化AI做事再添两将阿里云机械进修PAI DSW 20 u0026 Alink商业

Alink:流批一体机器学习算法平台

Alink拥有丰富的批式算法和流式算法,能够帮助数据剖析和运用开拓职员能够从数据处理、特色工程、模型演习、预测,端到端地完玉成部流程。
Alink供应的功能算法模块中,每一个模块都包含流式和批式算法。
比如线性回归,包含批式线性回归演习,流式线性回归预测和批式线性回归预测。
其余,Alink算法覆盖分类、回归、聚类、评估、统计剖析、特色工程、非常检测、文本、在线学习、关联剖析等经范例畴,是一个通用的机器学习算法平台。

算法性能

我们从下图中可以看出在回归算法中,Alink算法性能最高优于Spark 1.38倍;分类算法中Alink大多数算法性能优于Spark,最高优于2.52倍;聚类算法Alink算法性能最高优于Spark 1.85倍;协同过滤Alink算法性能最高优于Spark 2.26倍。

Flink VS Spark算法性能

更友好的交互式体验

我们供应两种用户利用界面:web和PyAlink。
Web界面供应拖拽的办法创建试验,通过对每一个组件进行配置完玉成部试验的参数配置。
在各个算法节点旁,我们用闪烁的小灯泡表示“运行中”的状态,用对勾✅表示“运行完成”的状态。
一样平常情形下,只有批式(batch)组件才有可能运行结束。
基于各个组件的运行状态,可以十分方便地判断当前实验运行到了什么程度。

同时为了知足脚本用户的需求,我们供应了PyAlink on notebook,用户可以通过PyAlink的python包利用Alink。
PyAlink支持单机运行,也支持集群提交。
并且打通Operator(Alink算子)和DataFrame的接口,从而使得Alink全体算法流程无缝融入python。
PyAlink也供应利用Python函数来调用UDF或者UDTF。

阿里云机器学习PAI是覆盖人工智能全链路的产品家族,自上线以来,受到广大AI开拓者的喜好,经由精益求精,证明不仅适宜个人和团队研发,也支持大规模算法竞赛和教诲培训。
本次重磅发布的PAIDSW2.0和商业版Alink致力成为最懂用户的轻量化AI做事,包含数据处理、建模、演习、模型优化、在线预测等多种产品版块,为用户供应一站式体验做事。