Learning Roadmap
Algorithm Internship Roadmap
从基础语法到算法实习作品集
这是一版学习路线 demo,把当前博客里的 Python、C++、数学、数据分析和项目文章串成可执行路径。 目标不是收藏文章,而是每个阶段都有明确产出:能写代码、能复盘、能做项目、能给面试官看。
先把工程脚本、基础数据结构和刷题基本功打稳。这个阶段的产出是能独立写小脚本、能解释代码、能完成数组和字符串题。
能写 logging + argparse 脚本;能手写 dict 计数、排序、BFS;能用 C++ 写数组和函数题。
线性代数和优化是理解机器学习、深度学习和检索推荐的底层语言。重点是把公式翻译成直觉和应用。
能解释向量空间、矩阵分解、PCA、SVD、凸性、KKT 和梯度下降的作用。
算法实习离不开数据。这个阶段训练从表格数据到分布式计算的工作流:读数据、清洗、聚合、特征、评估。
能独立完成 EDA、groupby、merge、SparkSQL 查询,并把数据处理流程写成脚本。
把基础能力落到项目里。先做传统机器学习 baseline,再接 BERT/LoRA/XGBoost hybrid,形成可讲的项目故事。
能讲清数据、baseline、模型改进、指标、错误分析和下一步优化。
下一阶段建议补齐深度学习训练闭环,然后做一个最小 RAG demo 和一个搜索/推荐 baseline。
- PyTorch tensor / autograd / training loop
- RAG: chunking / embedding / retrieval / rerank / evaluation
- Search & Rec: recall / ranking / metrics / baseline
能把 demo 部署成可运行项目,并写成项目文章。
本月执行看板
Python 工程化、C++ 基础、Pandas 数据处理、数组题。
PyTorch 最小训练闭环、RAG demo、项目 README 强化。
情感分析项目、Big Data 教程、SVD/Tensor 数学笔记。
Learning Roadmap