Data Science / NLP / LLM Applications

RichardF 的技术作品集与学习实验室

大四学生,正在系统整理 Python 工程、数据科学、机器学习、NLP/LLM 应用、 数学笔记和项目复盘。这里既是学习档案,也是逐步成型的技术作品集。

NLP / LLM ApplicationsData Science / Big DataPython / C++ / PyTorch
Current TrackLearning in Public

把课程项目、技术笔记和实验记录整理成长期可回看的作品体系。

16 posts6 projects4 tracks
NLP Portfolio Project

Stock Market Sentiment Classification

从传统机器学习 baseline 到 DistilBERT + LoRA,再到 XGBoost hybrid 的完整情感分类项目。

DistilBERT / LoRA / XGBoost / Macro F1
01Programming Core

Python、C++、算法题、项目结构和可复现脚本。

02Math for ML

线性代数、SVD、张量分解、优化和模型背后的数学。

03Data Systems

Pandas、Dask、Spark、特征工程和大数据分析。

04Portfolio Output

把项目文章、GitHub、实验结果整理成可面试讲述的作品。

Recent Posts

Python 从入门语法到算法实习工程化:基础、数据结构、脚本、日志与项目模板

这篇文章是给“想投算法实习”的 Python 学习路线。它从最基础的语法开始,但目标不是停在 ifforlist 这些知识点,而是一路接到真实项目里会用到的工程能力:函数拆分、模块组织、文件读写、异常处理、日志、命令行参数、配置文件、实验记录和可复现脚本。

算法实习里的 Python 通常有两种用法:一种是写算法题,要求代码清楚、边界严谨;另一种是写项目和实验脚本,要求数据能读、模型能跑、参数能改、日志能查、结果能复现。这篇文章会把两条线接起来。

阅读更多

Python 计算思维入门到实用:函数、循环、条件、排序、矩阵、图与最短路

这篇笔记根据 COMP1010 / COMP1002 计算思维与问题求解资料整理。它和普通 Python 语法教程不太一样:重点不是“Python 有哪些语法”,而是“拿到一个问题之后,怎样把它拆成可以执行的步骤,再用 Python 写出来”。

如果你以后想继续学数据分析、机器学习、搜索推荐、NLP 或 AI infra,Python 的价值不只是写脚本,更重要的是训练一种能力:把模糊问题变成输入、输出、数据结构和算法流程。

阅读更多

C++ 程序设计入门到实用:语法、函数、数组、算法、类与指针

这篇笔记根据 AMA2222 Principles of Programming 的课件整理,目标不是把 C++ 语法逐条背下来,而是建立一条能真正写程序的路线:先理解输入、输出和变量,再用条件与循环控制程序流程,然后用函数拆分问题,用数组和字符串保存数据,用搜索、排序、递归训练算法思维,最后进入类、继承、运算符重载、指针和动态内存。

如果你是从 Python 转到 C++,最重要的差异是:C++ 更强调类型、内存、编译和程序结构。Python 里很多事情解释器帮你处理了,C++ 会要求你明确地告诉电脑变量是什么类型、数组有多大、函数返回什么、对象如何初始化,以及什么时候申请或释放内存。

阅读更多

C++ Lecture 1:基础语法入门

这是一篇早期 C++ 入门课堂笔记,内容比较碎片化。更完整、系统、适合作为主线学习的版本请阅读:C++ 程序设计入门到实用:语法、函数、数组、算法、类与指针

为什么要学 C++

C++ 比 Python 更接近底层,语法也更严格。它需要你明确变量类型、函数返回值、头文件和编译过程。

对于算法岗来说,C++ 很重要,因为很多笔试、竞赛和高性能系统都会用 C++。对于未来想做 AI Infra 或推理优化的人来说,C++ 也是绕不开的基础。

阅读更多