🐍 Python 深度研究
本目录收录 Python 语言核心机制、高级特性、工程实践及底层原理的深度研究笔记。
🧭 知识图谱 (Knowledge Graph)
01. 基础与工程 (Core & Engineering)
- 代码规范:简明 Python 代码规范 (AI Rules)
- 变量与类型:变量工程指南 (解包、命名哲学、类型注解)
- 注释与文档:注释与文档指南 (Google Style Docstring)
- 数值计算:数值工程指南 (浮点陷阱、Decimal、魔术数字)
- 字符串处理:字符串工程指南 (F-string、编码、性能优化)
- 容器与集合:容器工程指南 (底层实现、可变性、自定义容器)
- 流程控制:异常处理最佳实践、上下文管理器 (
with)
02. 数据获取与爬虫 (Web Scraping)
- 爬虫原理:基础原理与反爬对抗 (HTTP/2/3, TLS 指纹, 浏览器指纹)
- 网络请求:请求库详解 (urllib, requests, httpx, Selenium, Playwright)
- 解析技术:解析库详解 (XPath, BeautifulSoup, pyquery)
- 数据存储:存储方案详解 (文件, MySQL, MongoDB, Redis)
- 框架应用:Scrapy 分布式爬虫
03. 数据分析与可视化 (Data Analysis)
- NumPy:向量化运算核心
- Pandas:数据清洗与高级处理 (Groupby, Window Functions)
- Polars:新一代高性能数据处理库
- 可视化:Matplotlib, Seaborn, ECharts
04. 机器学习与 AI (AI & LLM)
- Scikit-learn:传统机器学习算法
- PyTorch:深度学习基础
- LLM 应用:LangChain / LlamaIndex 架构
- Prompt Engineering:提示词工程
05. Web 开发与展示 (Web Dev)
- Streamlit:快速构建数据 Dashboard
- FastAPI:高性能 API 开发
- Flask:微框架应用
06. 办公自动化 (Automation)
- Excel 处理:openpyxl / xlwings
- 文档处理:PDF, Word 自动化
- 脚本工具:文件管理、邮件自动发送