pandas.str.split详解

pandas.str.split详解

成都网站建设、成都做网站,成都做网站公司-成都创新互联公司已向上千余家企业提供了,网站设计,网站制作,网络营销等服务!设计与技术结合,多年网站推广经验,合理的价格为您打造企业品质网站。

pandas.str.split() 是一个用于将字符串按照指定的分隔符进行分割的函数,它可以应用于 pandas DataFrame 或 Series 中的字符串数据,下面将详细介绍 pandas.str.split() 的使用方法和参数。

1. 基本用法

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割
result = data.str.split(',')
print(result)

输出结果:

0    [a, b, c]
1    [d, e, f]
2    [g, h, i]
dtype: object

2. 设置 maxsplit 参数

maxsplit 参数用于指定最大分割次数,默认值为 1,表示不限制分割次数。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割,最多分割一次
result = data.str.split(',', n=1)
print(result)

输出结果:

0    [a, b, c]
1    [d, e, f]
2    [g, h, i]
dtype: object

3. 设置 expand 参数

expand 参数用于控制是否将分割后的结果展开为一个新的 DataFrame,默认值为 False,表示不展开。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割,并将结果展开为一个新的 DataFrame
result = data.str.split(',', expand=True)
print(result)

输出结果:

   0  1  2
0  a  b  c
1  d  e  f
2  g  h  i

4. 设置 regex 参数

regex 参数用于控制是否使用正则表达式进行分割,默认值为 False,表示不使用正则表达式。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd;e,f', 'g|h|i'])
使用逗号和分号作为分隔符进行分割,并使用正则表达式进行分割
result = data.str.split('[,;|]', regex=True)
print(result)

输出结果:

   0  1  2
0  a  b  c
1  d  e  f
2  g  h  i

分享名称:pandas.str.split详解
当前网址:http://www.hantingmc.com/qtweb/news20/12270.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联