JOIN可以用join()
或执行merge()
。默认情况下, join()
将在其索引中加入DataFrame。每个方法都有参数,允许您指定要执行的联接类型(LEFT,RIGHT,INNER,FULL)或要联接的列(列名称或索引)。
假设我们有两个与我们的DataFrame具有相同名称和结构的数据库表。
现在我们来看看各种类型的JOIN。
merge()
还提供了一些参数,当您想要将另一个DataFrame的索引与另一个DataFrame的列结合时。
pandas还允许FULL JOIN,它显示数据集的两端,无论连接的列是否匹配。在写作时,所有的RDBMS(MySQL)都不支持FULL JOIN。
UNION ALL可以使用concat()
。
SQL的UNION与UNION ALL类似,但UNION将删除重复的行。
pandas可以concat()
与drop_duplicates()
一起使用 。
同样使用rank(method ='first')函数
找到每个性别组(小于3)的提示(提示<2)。请注意,当使用rank(method='min')
函数 rnk_min对于相同的提示(与Oracle的RANK()函数)保持相同时;
在pandas中,我们选择应该保留的行,而不是删除它们
今日赠言
做技术遇到不会的不懂的时候应该怎么做呢,请教别人还是自己专研呢?如果时间紧急你又可以找到紧密相关的技术大牛,那讨教一番是绝对助益的。但是绝大多数我们都是一个人面对的,所以一定要有自己处理问题和自学的能力;能决定你未来的人是你自己,不是任何别的其他人!
推荐阅读:
python学习篇
机器学习篇
自然语言处理中的Attention Model:是什么及为什么
from:http://pandas.pydata.org/pandas-docs/stable/comparison_with_sql.html