pandas多条件模糊匹配两个表

在Pandas中,我们可以使用merge()函数进行多条件模糊匹配,假设我们有两个表df1和df2,我们想要根据某些列的值进行模糊匹配。

网站建设哪家好,找创新互联公司!专注于网页设计、网站建设、微信开发、小程序定制开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了潢川免费建站欢迎大家使用!

步骤如下:

1、我们需要导入pandas库。

import pandas as pd

2、我们创建两个数据框df1和df2。

df1 = pd.DataFrame({
    'A': ['foo', 'bar', 'baz', 'qux'],
    'B': ['one', 'one', 'two', 'three'],
    'C': ['small', 'large', 'large', 'small'],
    'D': [1, 2, 2, 3],
    'E': [2, 4, 5, 5]
})
df2 = pd.DataFrame({
    'A': ['foo', 'bar', 'baz', 'qux'],
    'B': ['one', 'one', 'two', 'four'],
    'C': ['small', 'large', 'large', 'small'],
    'F': [10, 20, 30, 40],
    'G': [50, 60, 70, 80]
})

3、接下来,我们可以使用merge()函数进行多条件模糊匹配,在这个例子中,我们将根据列’A’、’B’和’C’的值进行匹配。

result = pd.merge(df1, df2, on=['A', 'B', 'C'])

这将返回一个新的数据框,其中包含df1和df2中满足条件的行。

注意:merge()函数默认执行的是内连接(inner join),这意味着只有当两个表中的行在指定的列上都有匹配时,才会出现在结果中,如果你想执行其他类型的连接(如左连接、右连接或全连接),你可以传递相应的参数给merge()函数。pd.merge(df1, df2, on=['A', 'B', 'C'], how='outer')将执行全连接。

文章题目:pandas多条件模糊匹配两个表
标题URL:http://www.hantingmc.com/qtweb/news27/138777.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联