1、数据准备
有效管理和优化数据集,为顺利进行分析奠定坚实的基础。连接、导入和构建原始数据,确保其准确性和易用性。
(1)从本地文件或数据库获取数据
轻松开始处理数据,无论数据是存储在本地还是云端。dataspell 可以连接 50 多个数据库和本地文件格式,在专用的 data tool(数据工具)窗口中显示所有数据源。
(2)使用 data wrangler 或 ai 清理数据
轻松清理数据,有无代码均可。data wrangler 提供了交互式无代码数据清理方式,并且可以借助 ai 聊天处理数据。
(3)直观呈现数据
使用 ai 或无代码工具轻松直观呈现数据。借助 graph builder,您可以轻松创建复杂的交互式图形。点击几下即可利用 ai 生成数据可视化效果。
2、数据分析
利用 ai 赋能数据分析、无代码工具或代码辅助工作流解锁洞察。从简单到高级的数据分析,dataspell 让一切都变得轻松。
(1)将工作负载委托给 ai
在 dataspell 中,ai 是核心功能,致力于增强数据分析。从领先供应商最新模型赋能的 ai 聊天,到 ai 智能体和 ml 赋能代码补全,您的数据工作将比以往更加顺畅高效。
(2)无代码数据分析
多种 ai 智能体,专为精准、高质量分析打造。使用 data wrangler 进行无代码 ai 赋能数据操作,或使用可视化工具加载、操作和直观呈现数据,无需编写任何代码。
(3)一流的 jupyter notebook 支持
dataspell 提供了具有一流 python 和 sql 支持的 notebook,以及无代码和 ai 功能。
3、数据报告
将发现转换为富有实用价值的报告,并轻松与利益相关者分享。使用无缝导出、报告和协作工具,有效传达您的洞察。
(1)将 notebook 导出为报告
以 pdf、html、markdown 等多种格式共享 notebook 报告。
(2)将 notebook 导出为代码
将 notebook 导出为 python 代码,然后在 github、s3、databricks 和其他平台上进行数据分析自动化或进一步处理。
(3)导出数据
除了从脚本文件、csv、tsv 或具有分隔符分隔值的文本文件导入之外,您还可以使用您喜欢的格式导出数据,包括 csv、json、html、markdown、excel 等。此外,您甚至可以自行创建自定义格式!
4、使用您喜爱的工具和技术
dataspell 是 jetbrains 产品系列的一部分,为处理代码和数据提供了强大的平台和一流的工具。享受高级功能,进行更深入的数据分析并获取广泛的自定义选项。
(1)版本控制
使用 git 和 github 保存工作并展开协作。借助本地历史记录,您永远不会丢失成果。
(2)python 语言支持
一流的 python 支持,具有 ml 赋能代码补全和动态错误检查。
(3)r 语言支持
集成式 r 支持,具有代码补全、错误检查和库集成。
(4)数据库客户端
使用代码、无代码和 ai 处理 50 多种 sql 和 nosql 数据库。
(5)丰富的插件生态系统
超过 5,000 个插件,带来增强的功能和自定义。