热门排行
简介
知名软件 IntelliJ Idea IDE 和 Kotlin 编程语言的开发商 JetBrains 推出了一个专门针对数据科学的 IDE —— DataSpell。
该 IDE 将为从事探索性数据分析和机器学习模型原型设计的数据科学专业人士提供了一个开发环境。其特色是一个旨在优先处理数据的界面,同时允许编码。根据 JetBrains 的说法,DataSpell 对 Jupyter Notebook 提供支持,并提供了比传统 Jupyter Notebook 更好的体验。用户可以在命令和编辑模式之间切换,以操作单元格及其内容,其中增强的功能包括:
针对 Python 的智能编码辅助
开箱即用的目录
折叠式回溯
交互式表格
单元格输出支持 Markdown 和 JavaScript。DataSpell 与运行在本地设备上的 Jupyter Notebook 以及远程 Jupyter、JupyterHub 和 JupyterLab 服务器兼容。
此外,DataSpell 支持 Python 脚本,提供了一个运行代码的 REPL,以及用于处理数据和数据可视化的额外工具,包括可交互式的和静态的。DataSpell 还支持包括 Plotly、Bokeh、ipywidgets 和 Altair 在内的 Python 科学类库。目前这个尚处于早期预览阶段的 DataSpell 除了支持 Python 以外,还提供了对 R 语言的基本支持,将来还会增加对 Julia 等其他数据科学语言的支持。
当然,在引入任何需要工具时,使用习惯是最大的挑战,因为每个数据科学团队都有一套自己常用的工具和定义的工作流程。DateSpell 如何能够快速融入数据科学家团队的工作流程,以提高生产力也将是 JetBrains 面临的一大挑战。
使用说明
首次运行软件需要注册账户进行登录
更新日志
DataSpell 2024.3:JetBrains Data Wrangler 和对 R 4.4 的支持
在 DataSpell 2024.3 中,新的 JetBrains Data Wrangler 可以简化数据清理和准备,自动执行平均占数据处理总时间 30-40% 的任务。 此版本还增加了对 R 4.4 的支持,通过改进的语言功能增强编码体验。
从我们的网站下载新版本的 DataSpell,直接从 IDE 或通过免费的 Toolbox App 更新,或使用 Ubuntu 的 snap 包。
JetBrains Data Wrangler:用于数据清理和数据准备的无代码工具
根据我们的研究,数据清理和准备占数据工作的 30-40%。 为了提高效率和生产力,自动执行这些阶段至关重要,并且应该包括两个步骤:针对数据操作优化 API 和 UI,以及使用 LLM 代理实现引导流程。
JetBrains Data Wrangler 是这一自动化的第一步。 我们从表数据开始,并将扩展该工具以支持更多数据格式。 JetBrains Data Wrangler 使用一系列人性化操作帮助您准备数据,以供进一步处理。
筛选
清理并移除
查找和替换
此外,JetBrains Data Wrangler 还能让您直接使用有效函数解决统计问题:
最小-最大缩放
Z 分数归一化
使用 IQR(四分位距)检测异常值
去偏度
使用 MAD(中位数绝对偏差)检测异常值
使用欧几里得距离检测异常值
数据操作伴随着代码生成,这会增强基本数据导出并提供使用转换结果作为新单元的功能。
使用 JetBrains Data Wrangler 转换数据
查看更改历史记录
以方便的格式导出数据
使用转换作为新单元
对 R 4.4 的支持
我们引入了对 R 4.4 的支持。 现在,您可以开始在 DataSpell 中的项目中利用该语言的最新功能。