Projects

Portfolio Demo

项目作品集

这里把博客里的项目、课程实践和可继续扩展的作品集中展示。每张卡片都尽量回答三个问题: 这个项目解决什么问题,用了什么技术,下一步还可以怎样继续打磨。

学习路线 知识图谱 GitHub
Portfolio Overview

把项目、课程实践和数学笔记放在同一个作品集中展示

这个页面不只展示“完成了什么”,也展示每个项目背后的方法、技术栈和继续扩展的空间。 目标是让读者快速看懂我的技术兴趣、学习路径和项目能力。

6项目卡片
4能力方向
2探索计划
Data Engineering Course Project

DSAI4205 Big Data Hands-on

围绕 Pandas、Dask、Spark RDD、SparkSQL、PageRank、NoSQL 等主题整理的 Big Data 动手教程, 适合展示数据处理和分布式计算基础。

Tech
Pandas, Dask, PySpark, SparkSQL
Next
补一个可运行 notebook 索引和实验截图
Math / ML Concept Portfolio

SVD and Tensor Notes

用 SVD、低秩近似、推荐系统、PCA、SVM kernel、Tensor/CP/Tucker 等内容连接线性代数和机器学习。 适合作为数学理解型作品。

Tech
SVD, PCA, Tensor Decomposition
Next
加入 NumPy demo 和可视化实验
Python Engineering Foundation

Python for Algorithm Internship

从 Python 基础语法一路接到 logging、argparse、项目结构、配置文件、实验输出和训练脚本骨架。 这是后续项目代码质量的基础设施。

Tech
Python, logging, argparse, pathlib, JSON
Next
配一个小型词频统计 CLI demo
LLM App Planned

Mini RAG System

下一步可以做一个最小 RAG 系统:文档切分、embedding、向量检索、rerank、回答生成和评估。 这个项目会把 NLP 笔记、检索系统和工程脚本连接起来。

Tech
Embedding, Retrieval, Rerank, Evaluation
Output
README, demo script, evaluation report
Search / Rec Planned

Search and Recommendation Baseline

预留一个搜索/推荐 baseline:召回、排序、指标、误差分析。可以从 MovieLens 或公开电商数据集开始。

Tech
Recall, Ranking, MAP, NDCG
Output
Notebook + script + project article

项目补强原则

Readable

README 要写清楚数据、环境、命令和结果,不让读者猜。

Runnable

尽量让项目能用一两条命令跑通 baseline。

Comparable

有 baseline、有指标、有错误分析,才能体现算法思考。

作者

RichardF

发布于

2026-06-25

更新于

2026-06-25

许可协议