Pandas是一个开源工具包,它为数据科学家和分析师提供了使用Python数据操作和分析能力。Pandas库在机器学习和深度学习的预处理阶段非常流行。但现在有了AI的加持,你可以用它做更多事情。
本文介绍一个新的数据科学库——Pandas AI。一个将生成型AI能力整合到Pandas中的Python库,使数据帧架具有对话性。
(相关资料图)
让数据帧具有对话性是什么意思?
正如其名,你可以与数据集进行对话,并得到快速响应。作为一名数据科学家或分析师,不需要再对着数据集进行无休止地浏览行和列。不过,Pandas AI并没有取代Pandas,它只是赋予了Pandas更强的能力!
数据科学家和分析师在分析阶段花费了大量的时间来清理数据。现在,他们将能够把数据分析提高到一个新的水平。数据专业人员研究不同的方法和流程,他们可以用这些方法和流程来最大程度地减少数据准备的时间,而现在他们可以使用Pandas AI。
PandasAI是与Pandas一起使用的,它不是Pandas的替代品。你可以向PandasAI提出有关数据集的问题,它将以Pandas DataFrames的形式返回答案,而不需要自己粗略地浏览和解决这些问题。
在OpenAI API的帮助下,Pandas AI旨在实现与机器进行虚拟对话以输出你想要的结果的目标,而不是必须自己编程完成任务。机器会用他们的语言输出结果 —— 机器可解释的代码(DataFrame)。
如何使用Pandas AI?使用pip安装Pandas AIpip install pandasai
使用OpenAI导入PandasAI为了使用新的Pandas AI库,你需要一个OpenAI密钥。一旦在笔记本上启动后,你需要导入以下内容:
import pandas as pdfrom pandasai import PandasAIfrom pandasai.llm.openai import OpenAIllm = OpenAI(api_token=your_API_key)
如果你没有独特的OpenAI API密钥,你可以在OpenAI平台上创建一个账户,并在这里创建一个API密钥。你将收到一个5美元的积分,可用于探索和试验API。
完成所有设置后,你就可以开始使用Pandas AI了。
在Dataframe上运行模型首先,你需要将OpenAI模型运行到Pandas AI:
pandas_ai = PandasAI(openAImodel)
然后,你需要在dataframe上运行模型,该模型由两个参数组成,即你正在使用的dataframe和你想问的问题:
pandas_ai.run(df, prompt="the question you would like to ask?")
例如,你可能正在查看数据集,并对某一列值大于5的行感兴趣。你可以通过使用Pandas AI来执行此操作:
import pandas as pdfrom pandasai import PandasAI# 示例DataFramedf = pd.DataFrame({ "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"], "gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064], "happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]})# 实例化一个LLMfrom pandasai.llm.openai import OpenAIllm = OpenAI()pandas_ai = PandasAI(llm)pandas_ai.run(df, prompt="Which are the 5 happiest countries?")
它将返回一个DataFrame输出:
6 Canada7 Australia1 United Kingdom3 Germany0 United StatesName: country, dtype: object
它还具有执行更复杂查询的能力,例如数学计算和数据可视化。
如下是一个数据可视化的示例:
pandas_ai.run( df, "Plot the histogram of countries showing for each the gpd, using different colors for each bar",)
数据可视化输出:
图片来源:PandasAI
Pandas AI推出并不久,团队仍在研究如何改进这个库。如果你想看看使用Pandas AI的演示,请观看下面这段视频:
总结尽管Pandas AI并不能取代Pandas,但它是一个可以提升工作流程的便捷工具。虽然你可以向Pandas AI询问有关数据集的问题,但你仍然需要精通编程,以便在库出现错误时进行纠正。
关键词:
每日资讯:快来体验PandasAI数据分析,将Pandas和ChatGPT结合起来
今日关注:祥源新材:相关产品已进入国内新能源电池主要厂商资源池
聚水潭erp登录网址 聚水潭聚水潭erp登录入口|全球最资讯
全市电动自行车上牌量突破175万辆
宁海路62号民国建筑 环球新动态
辽源市玉米出苗率达95% 高于常年8个百分点
判了!“李鬼”搬家公司半路加价被判强迫交易罪
今日心无成语_心成语
新主控 TFORCE固态速度新纪录_每日讯息
天天热讯:今日最新更新内容 网上借款次数多怎么借不到款了 原因如下
大众探歌锁车喇叭响怎么设置_大众探歌锁车喇叭响怎么设置?|环球新消息
广西自驾游最佳路线图高清大图(广西自驾游最佳路线图)
取次花丛懒回顾 半缘修道半缘君全诗_取次花丛懒回顾半缘修道半缘君的意思
踏空科技股大涨行情!高盛:仅三分之一美国共同基金跑赢大盘 环球播报
当前动态:餐饮成本核算表格全套_餐饮成本核算表
【研报推荐】普华永道:创建世界一流企业税务管理体系——打造企业税务品牌 视讯
全球快讯:江苏出口狂飙,这座城市扛下了所有
暴雨天气注意出行安全_连发30天暴雨预警暴雨期间怎么安全出行
即时焦点:上交所:科创板已支持47家央企国企上市融资
腾亚精工:目前公司生产经营情况正常 内外部经营环境未发生重大变化_世界新要闻
sophiehulme中国专柜 sophiehulme
降息预期持续降温 金价料继续盘整以待数据指引
2022~2023年宁夏养老金上调方案细则和养老金调整新消息(附原文)
日出东方唯我不败一统江湖千秋万代_日出东方唯我不败风清月高
张都监血溅鸳鸯楼概括30字(求水浒传 张都监血溅鸳鸯楼 的概括)
快看:融资客看好7股 买入占成交超三成
揭示登革热媒介白纹伊蚊环状RNA的功能和机制
男子扳手腕竟导致骨折!医生提醒:运动前需热身|今日讯
世界热文:花溪区气象台发布大风蓝色预警信号【Ⅳ/一般】【2023-05-24】
即时:李佳琦溯源自然堂喜马拉雅,探求中国成分十年磨一剑的故事
天天观察:通源石油:公司境外收入主要通过在美国的控股子公司实现
三元生物股东鲁信资本已减持1.48%股份
立志选育好种子、种出好糯稻,孝南民营企业家孙俊返乡兴种业
华为可变光圈设备新专利公布,消息称支持无级调节、伸缩堆叠-全球观察
早盘开盘国内期货多数下跌 螺纹钢、纸浆等跌超2% 热头条
800只人工繁育绿海龟集中放流 刷新国内相关纪录
相关新闻