✏️ DeepNote:拳打 Jupyter!脚踢 Colab?
视频详细介绍了在线协作笔记本 DeepNote,分析了其相比 Jupyter 和 Colab 在界面美观、AI 辅助及团队协作方面的优势。
UP主: 沧海九粟 · 时长: 8:16 · 🔗 B站原视频
发布: 2024-07-11 · 收录: 2025-01-29
标签: DeepNote · Jupyter · 生产力工具 · 数据科学 · 在线协作
开场与本期主题
小伙伴们大家好,我是沧海者素。这周做了两期关于工具的分享,不知道对大家有没有帮助。手里正好还有一个存货,所以索性这周都讲工具。
这个工具后面在连圈的一些分享里也会用到,所以趁这个机会给大家一起做个展示。
DeepNote 是什么:在线版、更美观的 Notebook
这个工具平台叫 DeepNote。简单讲,就是一个在线的、界面更美观的 Jupyter Notebook。
之前其实给大家分享过一个类似的平台,但那个平台已经挂了,所以后来又找了一个这样的平台,自己在用,觉得还不错,借这个机会分享一下。
核心能力:Jupyter 功能齐全 + AI 建议 + 数据源集成
这个平台大体上就是:Jupyter Notebook 有的功能它都有,同时做了一些 AI suggestion 的植入。
这类平台基本都会有的核心功能,是汇聚非常多的 data source,各种 integrations 集成都会有。
另外在美观方面,会引入更多 chart、dashboard 之类的东西,来体现它各方面的能力。
官方对比:直接拿 Jupyter、Colab 等来 PK
比较有趣的是,这个平台其实蛮有自信的。如果你觉得为什么不用 Jupyter、为什么不用 Google Colab,或者用其他我觉得都很棒的平台,也没关系,它会提供和这些平台的对比。
比如另外一个界面也很美观、也很不错的平台叫 Hyperquery,你可以通过这些内容去做对比。它会很直白地告诉你:哪些我这边有优势,哪些人家会更好。
整体体验还是很棒的。
进阶玩法:组件、API、应用与可分享页面
除了上面看到的这些以外,它的核心功能还包括:
- 组件化能力:可以帮你更好地制作 notebook 里的小工具、小组件。
- notebook 可以变成 API、变成 application,让别人通过 API 去访问。
- 也可以做成一个别人可运行的页面,用来分享、同步、协同。
整体功能比较齐全,能力也比较充分。
价格与免费额度:Free Tier 的关键点
一般也会关心价格。它 pricing 页面还可以,如果想用 team 的话,整体也还行,一般差不多现在都是 30 美刀左右。
主要想说的是它有 free tier。我觉得选在线这些 Jupyter Notebook 时,free tier 是一个很重要的条件;如果没有,很多同学可能可用性就不强了。
它的免费包包含:
- 3 个人可以同时编辑
- 5 个 project,每个 project 里面可以有 N 个 notebook
- 一些基础的 code completion(非常基础)
- 每个 project 配一台机器:5G memory、2 vCPU
我用下来基本够用。特别是如果你开发的场景,全部是在调用在线 API,比如大语言模型推理接口、向量存储接口、其他数据库接口,全部是在线的 SAAS 服务,通过这种在线 notebook 平台用起来就很方便。
实际界面体验:官方 Welcome Notebook 与常见能力
实际使用时,比如官方的 welcome notebook,会展示一些内容,包括:
- 整体的 TOC
- 基础内容
- DataFrame 的展示
- 常见的 notebook cell
- 一些图表、组件等
能力还是很强的。付费可以用它的 AI;不付费的话,基础功能也都有,包括自己造一些比较好用的基础组件。
比如你可以做一个 select 组件,用来控制模型选哪个,这样会挺方便。chart、SQL 这些基础能力也都挺强。
开发场景:更偏数据工程,但写代码也顺手
一般在开发连圈项目时,用这种花里胡哨的展示可能少一点,数据工程会更多一点。
开发的时候更多还是写代码。在这种场景下它也很好用。
初始化脚本与依赖加载:requirements 更省心
它会有一个默认的 init 脚本,会帮你读取 requirement 的内容。你可以在这里把需要的 requirements 写好,它默认就会帮你加载,这块比较省心。
环境变量集成:项目内所有 Notebook 统一使用
我们会有大量环境变量,包括 LLMs、自己的推理接口、各种组件。
它有环境变量的 integration,里面内容非常多。把这些环境变量配好之后,在同一个 project 里的所有 notebook 都可以统一使用,而且不用再通过 OS 的方法去加载。
比如你要用 API key,环境变量配好就不用再加载了。我们自己在 VSCode 或传统 notebook 里,很多时候都得自己管理环境变量,不管用什么方式;在这里做得比较无缝,用起来方便。
协作与分享:应用、权限、评论、版本与 Terminal
分享给别人的时候,你可以创建一个应用,然后和别人分享。它可以生成一个页面,并且可以控制权限(可运行 / 不可运行)。
协作方面,免费版支持三个人同时协作,可以 comment。它也有版本和日志,之前所有 log 都能看到。
另外还有 terminal,你可以在这里创建 terminal,进入它的虚拟机。这个虚拟机默认就是 2 CPU、5G 内存,也支持配置 Python 环境等基础操作,上手很快。
结尾
大家如果对这些感兴趣,也愿意尝试使用在线的 Jupyter Notebook,不妨考虑一下这个平台:DeepNote。
那我们今天的分享就到这里,谢谢大家。