杰瑞科技汇

Python Jupyter教程该怎么学?

Python Jupyter 教程:从入门到精通

第一部分:什么是 Jupyter Notebook?为什么使用它?

想象一下,你有一个可以同时做三件事的神奇笔记本:

Python Jupyter教程该怎么学?-图1
(图片来源网络,侵删)
  1. 写代码:你可以像在任何代码编辑器里一样编写 Python 代码。
  2. 写文档:你可以用 Markdown 语法轻松地添加标题、说明、列表、公式,就像写一篇博客文章或报告。
  3. 看结果:代码运行后,图表、数据表格、图片、甚至视频都会直接显示在代码下方。

这个“神奇笔记本”Jupyter Notebook,它是一个开源的 Web 应用程序,允许你创建和共享包含实时代码、方程、可视化和文本说明的文档。

主要优势:

  • 交互式计算:逐块运行代码,即时查看结果,非常适合数据探索、原型设计和教学。
  • 一体化文档:将代码、解释和输出整合在一个文件中(.ipynb),便于复现分析过程和分享研究成果。
  • 可视化友好:是数据科学领域进行数据分析和可视化的标准工具。
  • 学习利器:对于初学者来说,可以清晰地看到每一步操作的结果,加深对代码逻辑的理解。

第二部分:安装与环境配置

在开始之前,你需要安装 Jupyter,强烈推荐使用 Anaconda 来安装,因为它已经为你打包好了 Python、Jupyter 以及数百个常用的数据科学库(如 NumPy, Pandas, Matplotlib)。

推荐使用 Anaconda (最简单)

  1. 下载:访问 Anaconda 官网 下载适合你操作系统的安装包。
  2. 安装:像安装普通软件一样双击安装包,一路点击 "Next" 即可,安装时会自动将 Anaconda 添加到系统路径,方便后续使用。
  3. 验证:安装完成后,打开终端(在 Windows 上是 "Anaconda Prompt" 或 "PowerShell")。
    • 输入 jupyter notebook --version,如果显示版本号,说明安装成功。
    • 输入 conda --version,验证 Anaconda 是否安装成功。

使用 pip (如果你已有 Python 环境)

如果你已经安装了 Python,可以直接使用包管理器 pip 来安装。

Python Jupyter教程该怎么学?-图2
(图片来源网络,侵删)
  1. 打开终端或命令提示符。
  2. 输入以下命令:
    pip install jupyterlab
    • jupyterlab 是 Jupyter 的下一代界面,功能更强大,体验更现代,你也可以安装经典的 jupyter notebook
      pip install notebook

第三部分:启动与初体验

启动 Jupyter

  1. 打开终端(Windows 用户请使用 Anaconda Prompt)。

  2. 导航到你想要存放工作文件的目录,我想在 Documents 文件夹下创建一个 Jupyter 文件夹:

    # 进入 Documents 文件夹
    cd Documents
    # 创建 Jupyter 文件夹
    mkdir Jupyter
    # 进入 Jupyter 文件夹
    cd Jupyter
  3. 在当前目录下,启动 Jupyter:

    # 启动经典 Notebook
    jupyter notebook
    # 或者启动更现代的 JupyterLab
    jupyter lab
    • jupyter notebook 会打开一个经典界面,标签页形式。
    • jupyter lab 会打开一个类似 IDE 的集成开发环境,功能更丰富。初学者建议从 jupyter notebook 开始

启动后,你的默认浏览器会自动打开一个新标签页,显示 Jupyter 的文件管理界面。

Python Jupyter教程该怎么学?-图3
(图片来源网络,侵删)

创建你的第一个 Notebook

  1. 在右上角点击 "New" -> "Python 3" (或者 "Python 3 (ipykernel)")。
  2. 一个新的浏览器标签页会打开,这就是你的第一个 Notebook!

第四部分:Notebook 界面详解

一个 Notebook 由一系列的 Cell (单元格) 组成,主要有两种类型的 Cell:

Code Cell (代码单元格)

这是用来编写和执行代码的地方。

  • 输入代码:在 [ ]: 后面输入你的 Python 代码。
  • 运行代码
    • 点击工具栏上的 "Run" 按钮。
    • 按快捷键 Shift + Enter:运行当前单元格,并自动跳转到下一个单元格。
    • 按快捷键 Ctrl + Enter:运行当前单元格,并停留在当前单元格。
  • 查看输出:代码执行的结果(如 print() 的输出、图表、变量值等)会显示在单元格的下方。

示例

# 这是一个简单的代码单元格
print("Hello, Jupyter World!")
# 你也可以直接显示变量值
a = 10
b = 20
a + b

运行后,你会看到:

Hello, Jupyter World!
30

注意:如果一个单元格只包含一个表达式(如 a + b),Jupyter 会自动显示其结果,但如果赋值(如 c = a + b),则不会显示任何输出,除非你显式地 print(c)

Markdown Cell (Markdown 单元格)

这是用来添加文本、标题、链接、图片等富文本内容的地方,非常适合写注释和说明。

  • 切换类型:选中一个单元格,在工具栏的下拉菜单中选择 "Markdown"
  • 编辑:双击 Markdown 单元格即可进入编辑模式,使用 Markdown 语法编写内容。
  • 渲染:像运行代码一样,点击 "Run" 或按 Shift + Enter,Markdown 内容就会被渲染成格式化的文本。

常用 Markdown 语法示例

| 语法 | 效果 | 代码 | | :--- | :--- | :--- || # 一级标题
## 二级标题 | # 一级标题
## 二级标题 | | 文本 | *斜体*
**粗体** | *斜体*
**粗体** | | 列表 | - 无序列表项1
- 子项
有序列表项1 | - 无序列表项1
- 子项
有序列表项1 | | 代码 | `行内代码`
<br>代码块<br> | `行内代码`
<br>python
print("代码块")
<br> | | 链接 | [Jupyter 官网](https://jupyter.org) | [Jupyter 官网](https://jupyter.org) | | 图片 | ![图片描述](图片链接或路径) | ![Jupyter Logo](https://jupyter.org/assets/main-logo.svg) | | 数学公式 | $行内公式:E=mc^2$
$$块级公式:\int_a^b f(x)dx$$ | $行内公式:E=mc^2$
$$块级公式:\int_a^b f(x)dx$$ |

其他常用操作

  • 插入 Cell:在工具栏点击 "Insert" -> "Insert Cell Above/Below",或使用快捷键:
    • a:在当前单元格上方插入一个新单元格。
    • b:在当前单元格下方插入一个新单元格。
  • 删除 Cell:选中单元格,点击工具栏的 "Cut""Delete",或按快捷键 d, d (快速按两下 d)。
  • 改变 Cell 类型:选中单元格,在工具栏下拉菜单中选择 "Code" 或 "Markdown"。
  • 重命名 Notebook:点击浏览器标签页上的标题,或点击工具栏的 "Rename" 图标。

第五部分:核心功能与技巧

Magics (魔法命令)

Jupyter 提供了一些以 或 开头的特殊命令,称为 "Magic Commands",可以极大地提升工作效率。

  • %run:运行一个 .py 文件。

    %run my_script.py
  • %timeit:测量一小段代码的执行时间,非常精确。

    %timeit [x**2 for x in range(1000)]
  • %matplotlib inline:将 Matplotlib 图表直接嵌入到 Notebook 中输出,这是数据可视化中最常用的 Magic。

    %matplotlib inline
    import matplotlib.pyplot as plt
    plt.plot([1, 2, 3, 4])
    plt.ylabel('some numbers')
    plt.show()
  • %%writefile:将一个单元格的内容写入到一个文件中。

    %%writefile test.txt
    This is a test file.
    Hello from Jupyter.

Tab 键自动补全与帮助

  • 代码补全:在输入变量或函数名时,按 Tab 键可以查看所有可用的选项。
  • 查看函数签名:在函数名后输入 并运行,可以查看该函数的文档字符串。
    len?
  • 查看源码:在函数名后输入 并运行,可以查看函数的源代码(如果可用)。
    len??

内联绘图

%matplotlib inline 是一个非常重要的 Magic,它告诉 Matplotlib 将生成的图像直接显示在 Notebook 的输出单元格中,而不是弹出一个新窗口。

重启内核

当你修改了导入的库或全局变量,但代码没有按预期工作时,可能需要重启内核,点击工具栏的 "Kernel" -> "Restart",这会清空内存中的所有变量,让 Notebook 恢复到初始状态,非常适合排查问题。


第六部分:保存与分享

  • 保存:点击工具栏的 "Save and Checkpoint" 图标或按快捷键 Ctrl + S,你的 Notebook 会自动保存为 .ipynb 文件。
  • 导出:Jupyter Notebook 可以导出为多种格式:
    • HTML:适合在网页上展示。
    • PDF:适合打印和正式报告。
    • Python (.py):导出为纯代码文件。
    • 点击 "File" -> "Download as" 选择你需要的格式。

第七部分:JupyterLab 简介

jupyter lab 是 Jupyter 的下一代界面,它不仅仅是一个 Notebook,而是一个完整的交互式开发环境。

  • 启动:在终端输入 jupyter lab
  • 特点
    • 灵活布局:可以将 Notebook、终端、文本编辑器、数据查看器等窗口以标签页或分屏的形式自由排列。
    • 文件浏览器:左侧有文件浏览器,方便管理项目文件。
    • 扩展性:可以通过安装扩展来增加更多功能。

对于简单的数据分析,jupyter notebook 足够用了,但对于复杂的项目开发,jupyter lab 提供了更专业的体验。


总结与进阶

恭喜你!你已经掌握了 Jupyter Notebook 的基本使用。

学习路径建议:

  1. 动手实践:尝试用 Jupyter 完成一些小任务,
    • 分析一个 CSV 文件(使用 Pandas 库)。
    • 用 Matplotlib 绘制一些简单的图表。
    • 练习 Markdown,写一篇关于你学习心得的笔记。
  2. 探索更多:深入学习 Pandas, NumPy, Matplotlib, Seaborn 等数据科学库,Jupyter 是你最好的实践场。
  3. 分享你的作品:将你的 Notebook 导出为 HTML 或上传到 Jupyter NbViewer,生成一个在线链接与他人分享。

Jupyter 是数据科学和 Python 学习的瑞士军刀,熟练掌握它将极大地提升你的学习和工作效率,祝你学习愉快!

分享:
扫描分享到社交APP
上一篇
下一篇