Data Science / NLP / LLM Applications

RichardF 的技术作品集与学习实验室

大四学生，正在系统整理 Python 工程、数据科学、机器学习、NLP/LLM 应用、数学笔记和项目复盘。这里既是学习档案，也是逐步成型的技术作品集。

查看作品集学习路线 GitHub

NLP / LLM ApplicationsData Science / Big DataPython / C++ / PyTorch

Current TrackLearning in Public

把课程项目、技术笔记和实验记录整理成长期可回看的作品体系。

16 posts6 projects4 tracks

NLP Portfolio Project

Stock Market Sentiment Classification

从传统机器学习 baseline 到 DistilBERT + LoRA，再到 XGBoost hybrid 的完整情感分类项目。

DistilBERT / LoRA / XGBoost / Macro F1

Big DataPandas / Dask / SparkSQL 实战路线 Engineering面向真实项目的 Python 工程能力

01Programming Core

Python、C++、算法题、项目结构和可复现脚本。

线性代数、SVD、张量分解、优化和模型背后的数学。

Pandas、Dask、Spark、特征工程和大数据分析。

04Portfolio Output

把项目文章、GitHub、实验结果整理成可面试讲述的作品。

Recent Posts

2026-06-24发表2026-06-24更新Optimization25 分钟读完 (大约3791个字)

最优化核心概念导览：Convexity、Duality、KKT 与数值优化

最优化是机器学习、数据挖掘、运筹、控制和 AI infra 里都会反复出现的一条主线。训练模型是在最小化 loss，推荐系统是在优化排序目标，推理系统是在优化吞吐和延迟；即使问题表面很不一样，背后经常都可以抽象成“目标函数 + 约束 + 求解算法”。

这篇文章根据 AMA4850 的复习材料整理，但这里不按考试提纲写，而是把它改写成一篇最优化知识导览：从凸性出发，接到对偶理论、KKT 最优性条件，再到梯度下降、拟牛顿法、罚函数和 barrier method。原 PDF 保留在这里，方便对照完整材料。