Skip to content

Python 数据科学

NumPy - 数值计算

数组操作

python
import numpy as np

# 创建数组
arr = np.array([1, 2, 3, 4, 5])

# 多维数组
matrix = np.array([[1, 2], [3, 4]])

# 常用操作
arr.mean()      # 平均值
arr.sum()       # 求和
arr.shape       # 形状

Pandas - 数据处理

DataFrame 操作

python
import pandas as pd

# 创建 DataFrame
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35]
})

# 常用方法
df.head()       # 前5行
df.describe()   # 统计描述
df.groupby()    # 分组

Matplotlib - 数据可视化

python
import matplotlib.pyplot as plt

plt.plot([1, 2, 3], [1, 4, 9])
plt.xlabel('x')
plt.ylabel('y')
plt.title('Simple Plot')
plt.show()

面试要点

  • Pandas 的 merge 和 concat 区别
  • NumPy 的广播机制
  • 处理缺失值的方法

基于 MIT 许可发布