Pandas 入门到实用:数据读取、清洗、合并、聚合与项目流程

Pandas 是 Python 中最常用的数据分析库之一。它适合处理表格数据,例如 CSV、Excel、实验记录、Kaggle 数据集、推荐系统日志和机器学习训练数据。

如果说 NumPy 更像“高效数组计算工具”,那么 Pandas 更像“带行列标签的表格处理工具”。它最适合做数据分析项目的前半段:读取数据、检查质量、清洗字段、构造特征、合并多张表、聚合统计,最后把干净的数据交给模型或可视化工具。

阅读更多

多元微积分 Lecture 1:向量、点积与叉积

课程背景

多元微积分是在一元微积分的基础上,把函数、导数、积分推广到更高维空间。

一元微积分研究的是一条线上的变化,多元微积分研究的是平面或空间中的变化。它在机器学习、优化、物理建模和计算机图形学中都很重要。

阅读更多

C++ Lecture 1:基础语法入门

这是一篇早期 C++ 入门课堂笔记,内容比较碎片化。更完整、系统、适合作为主线学习的版本请阅读:C++ 程序设计入门到实用:语法、函数、数组、算法、类与指针

为什么要学 C++

C++ 比 Python 更接近底层,语法也更严格。它需要你明确变量类型、函数返回值、头文件和编译过程。

对于算法岗来说,C++ 很重要,因为很多笔试、竞赛和高性能系统都会用 C++。对于未来想做 AI Infra 或推理优化的人来说,C++ 也是绕不开的基础。

阅读更多

向量空间与矩阵乘法背后的空间意义

前记

学习线性代数时,矩阵乘法经常被直接定义成一堆公式。公式当然重要,但如果只记公式,很容易不知道它到底在“改变什么”。

我更想从空间角度理解矩阵乘法:矩阵不仅是一张数字表,它也可以看成一种对空间的变换。

阅读更多

Kaggle Learning Log 1

Foreword

As a data science student, I started using Kaggle to practice machine learning and data analysis.

Kaggle is useful because it provides real datasets, public notebooks, competitions, and a community where beginners can learn from other people’s workflows.

阅读更多

我的第一篇博客

前记

想搭建一个自己的博客,其实已经是很久以前的想法了。

平时学习的东西很多,遇到一些有意思的问题、方法或者想法时,总希望能把它们记录下来。相比手写笔记,博客更容易整理,也更方便长期回看。

阅读更多