Pandas备忘录2

1. Pandas备忘录系列文章

Pandas备忘录

2. 介绍

Note: 如果没有特别说明，pd指的是pandas，np指的是numpy。

1 2	import pandas as pd import numpy as np

3. 查找

3.1. contains函数

主要是用Series.str.contains这个函数，如果参数regex设为True，则查找字符串解析为正则表达式，设为False则用常规查找方式

>>> s1 = pd.Series(['Mouse', 'dog', 'house and parrot', '23', 'frog'])
>>> s1
0               Mouse
1                 dog
2    house and parrot
3                  23
4                frog
dtype: object
>>> s1.str.contains('og', regex=False)
0    False
1     True
2    False
3    False
4     True
dtype: bool
>>> s1[s1.str.contains('og', regex=False)]
1     dog
4    frog
dtype: object

4. DataFrame增加行

4.1. append函数

可以使用append函数给DataFrame增加行

>>> df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))
>>> df
   A  B
0  1  2
1  3  4
>>> df2 = pd.DataFrame([[5, 6]], columns=list('AB'))
>>> df2
   A  B
0  5  6
>>> df.append(df2, ignore_index=True)
   A  B
0  1  2
1  3  4
2  5  6

4.2. 使用特定索引名称增加行

使用DataFrame的loc函数可以指定索引名称增加行，前提是得知道列的排列顺序，因此在创建DataFrame时要用columns参数指定列的排列顺序

>>> employees = pd.DataFrame(
...     data={'Name': ['John Doe', 'William Spark'],
...           'Age': [23, 24]},
...     index=['Emp001', 'Emp002'],
...     columns=['Name', 'Age'])
>>> employees
                 Name  Age
Emp001       John Doe   23
Emp002  William Spark   24
>>> employees.loc['Emp003'] = ['Sunny', 45]
>>> employees
                 Name  Age
Emp001       John Doe   23
Emp002  William Spark   24
Emp003          Sunny   45