Python 数据科学
NumPy - 数值计算
数组操作
python
import numpy as np
# 创建数组
arr = np.array([1, 2, 3, 4, 5])
# 多维数组
matrix = np.array([[1, 2], [3, 4]])
# 常用操作
arr.mean() # 平均值
arr.sum() # 求和
arr.shape # 形状Pandas - 数据处理
DataFrame 操作
python
import pandas as pd
# 创建 DataFrame
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35]
})
# 常用方法
df.head() # 前5行
df.describe() # 统计描述
df.groupby() # 分组Matplotlib - 数据可视化
python
import matplotlib.pyplot as plt
plt.plot([1, 2, 3], [1, 4, 9])
plt.xlabel('x')
plt.ylabel('y')
plt.title('Simple Plot')
plt.show()面试要点
- Pandas 的 merge 和 concat 区别
- NumPy 的广播机制
- 处理缺失值的方法