【教程】用大模型做数据分析,可视化,仅需一键|代码|key|csv|大语言模型

发布日期:2025-01-04 10:19    点击次数:181

⚠️ 对代码感兴趣,直接拉到文末大家好,我是章北海最近在外面冲浪看到@eviljer分享了 DeepSeek Coder 一步到位做数据分析的玩法。我复刻后试了一下,确实很爽只需要塞进去 excel,告诉它分析哪些指标,自动生成代码,自动执行,输出可视化图表。原文使用 DeepSeek 官方 API,我冲了 1 元钱,跑一次只需要花费 1 分钱如果一分钱都不想花呢?我注册了 siliconflow,免费赠送 14 元(即约 2000 万 Qwen1.5-14B 模型 tokens,或 500 张图片),够用1400次起步了!注册地址:https://cloud.siliconflow.cn?referrer=cly7ai3ir000jqab7qaqp0qwf它不但完美支持OpenAI API调用,还可以免费使用Qwen、GLM、Yi 等模型。上面演示的自动数据分析、可视化,我是用的是DeepSeek-Coder-V2这个模型我测试了,非常好用DeepSeek-Coder-V2:第一个开源模型在编码和数学方面击败了 GPT4-Turbo在编码和数学方面表现出色,击败了 GPT4-Turbo、Claude3-Opus、Gemini-1.5Pro、Codestral。支持 338 种编程语言和 128K 上下文长度。完全开源,有两种尺寸:230B(也具有 API 访问权限)和 16B。回归正题,如何实现自动生成代码,自动执行,输出可视化图表?代码如下:import re import pandas as pd from openai import OpenAI # 读取 CSV 数据 #file_path = "/Users/zz/Desktop/demo.csv" file_path = "替换成自己的 csv 文件路径" mydata = pd.read_csv(file_path) # 打印数据类型和表头 data_info = mydata.dtypes.to_dict() data_columns = mydata.columns.tolist() print("Data columns and types:", data_info) api_key = "sk-替换成自己的 api" # for backward compatibility, you can still use `https://api.deepseek.com/v1` as `base_url`. client = OpenAI(api_key=api_key, base_url="https://api.siliconflow.cn/v1") # 构造请求信息 messages = [ {"role": "system", "content": "You are a helpful assistant.\n Based on the dataset user provided, do not assume.\n Think step by step, \nUse Markdown to format the output."}, {"role": "user", "content": f"根据接收的数据字段和类型:{data_info}, CSV 路径:{file_path}, 1、用 plotly 图表分析内容标题,做个阅读超过 1000 点文章排行;2、对排名前五的文章做描述性分析,选用适当的图表进行可视化;3、分析哪些文章阅读情况比较良好;4、分别帮我找出阅读后关注人数、送达阅读率、首次分享率前五的文章名;注意:直接给我最终代码即可,不要写注释"} ] response = client.chat.completions.create( model="deepseek-ai/DeepSeek-Coder-V2-Instruct", messages=messages, stream=False ) response_code=response.choices[0].message.content code_blocks = re.findall(r'```(.*?)```',response_code,re.DOTALL) cleaned_code_blocks = [code.replace("python\n","") for code in code_blocks] for code in cleaned_code_blocks: exec(code)粘贴到Jupyter NoteBook,替换file_path、api_key成自己的,修改 messages 中你想让大模型做的数据分析任务,执行即可。如果你有别的大模型的 api,这套代码依然适用,额外替换一下base_url、model即可.messege 也可以任意修改,比如我让它把图表背景改成黑色,输出就是这样‍‍‍‍

上一篇:航海及海运专业英语词汇(E5)
下一篇:NFT Insider #130:Solana链上NFT破55亿美元;中国日报推出NFT福|nft|仙境传说|网络游戏|insider|sandbox

Powered by CHO中文网 @2013-2022 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024