使用ChatGPT自动编写Python爬虫脚本

闪电发卡1年前ChatGPT766

都知道最近ChatGPT聊天机器人爆火,我也想方设法注册了账号,据说后面要收费了。

ChatGPT是一种基于大语言模型的生成式AI,换句话说它可以自动生成类似人类语言的文本,把梳理好的有逻辑的答案呈现在你面前,这完全不同于传统搜索工具。

ChatGPT不光可以回答人文、科学、情感等传统问题,还可以写代码、改bug,程序员可就急了,简直是在抢饭碗,所以网上出现各种ChatGPT让你失业的焦虑言论。

俗话说“百闻不如一见”,我试着让ChatGPT用Python去写爬虫脚本,看它到底行不行?

1、爬取知乎上的专栏文章

提问:

帮我用python写代码爬取这个网站的文章 https://zhuanlan.zhihu.com/p/595050104

ChatGPT:

把给到的代码放进PyCharm中跑一遍,发现没有报错,且打印出了内容。

import requests
from bs4 import BeautifulSoup

url = "https://zhuanlan.zhihu.com/p/595050104"response = requests.get(url)soup = BeautifulSoup(response.text, "html.parser")title = soup.find("h1", class_="Post-Title").text.strip()body = soup.find("div", class_="Post-RichText").text.strip()print("Title:", title)print("Body:", body)

虽然说ChatGPT给出的代码可以执行,但它也提到由于爬取的网站会随时变更,也就是HTML会变动,所以代码可能需要调整才能正常工作。

凡是写过爬虫的同学应该都能理解,人工写的爬虫代码也没法一劳永逸,需要随时改。

这一点ChatGPT提示的很有道理。

后来我测试了medium、百家号上的文章,ChatGPT提供的代码形式几乎和上面一致,没法直接执行获取结果,需要微调后才能跑。

2. 爬取京东某商品的评论

为了给ChatGPT增加难度,我试着让它去爬取某电商网站的用户评论

提问:

请用python写代码爬取这个京东商品的所有用户评论  https://item.jd.com/13652780.html

ChatGPT:

可能这个网页是动态页面,ChatGPT提供的方法并不能爬取评论。

我接着问:

爬取的结果是空值怎么办?

ChatGPT:

ChatGPT提供了3种可能存在的原因,但并没有帮我修改代码。

于是我又问:

还是空值 请帮我重新写代码爬取

ChatGPT:

image.png

这次就牛掰了,它重新用Selenium写了爬虫代码,并告诉我爬取动态网页需要模拟浏览器行为,因此得用selenium技术。

我没有运行去测试代码正确与否,但ChatGPT确实惊艳到我了,能够前后关联对话内容,并给出正确的解决方法。

3.继续更多的测试

上面只是蜻蜓点水的玩玩,ChatGPT就已经吸引到我,

我准备多花时间去测试ChatGPT应对各种爬虫的解决方案,以及它对bug的修复能力。

仅仅从写代码层面看,ChatGPT已经可以媲美中高级程序员的水平了,而且它的知识范畴远超人类最厉害的程序员

ChatGPT能够根据对话生成人想要的内容,这是AI巨大的突破,未来它的应用之广难以想象。


闪电发卡ChatGPT产品推荐:

ChatGPT Plus共享账号:https://xingtupai.com/post/319.html

ChatGPT Plus独享账号(购买充值代充订阅):https://xingtupai.com/post/306.html

ChatGPT APIKey购买充值(直连+转发):https://xingtupai.com/post/305.html

ChatGPT Plus国内镜像逆向版:https://xingtupai.com/post/312.html

ChatGPT国内版(AIChat):https://xingtupai.com/post/318.html


相关文章

Sora账号购买注册方法使用保姆级教程

Sora账号购买注册方法使用保姆级教程

Sora是一款能够根据文本提示生成高质量视频的工具,近期被公布后热度非常高。它支持长达60秒的视频生成,提供多角度镜头切换,能够模拟物理效果,如咬痕或踩奶效果,甚至可以从图片生成视频。很多小伙伴都很关...

适用于 PHP 应用程序的 GPT-4 和 GPT-3.5 ChatGPT API 客户端

适用于 PHP 应用程序的 GPT-4 和 GPT-3.5 ChatGPT API 客户端

添加图片注释,不超过 140 字(可选)自从去年 10 月发布OpenAI PHP API 客户端以来,我们已经看到成千上万的用户使用 OpenAI API 构建了一些令人惊叹的应用程序。在此期间,O...

chatgpt新版gpt-3.5-turbo模型API教程

形式:输入一个问题,模型会生成一个结果,一问一答形式功能:创建一个聊天接口地址:POST https://api.openai.com/v1/chat/completions (B...

美国有50%企业在用ChatGPT了!一半人表示员工已被AI取代

美国有50%企业在用ChatGPT了!一半人表示员工已被AI取代

【导读】美国最新调查显示,50%企业已经在用ChatGPT了,一半人表示,ChatGPT已经替代了员工。这一天终于来了?ChatGPT果然开始取代人类了!美国《财富》杂志网站近日报道,工作建议平台Re...

用爆火的 ChatGPT AI 自动写代码、改Bug,太爽了!

用爆火的 ChatGPT AI 自动写代码、改Bug,太爽了!

这两天,被一款集写文章,写代码,找Bug、聊天、写歌等多功能的AI对话软件 ChatGPT 刷爆了朋友圈;就连马斯克都亲自出来为其站台,发了多条推特来夸赞它的强大;如果就AI聊天、写作什么的,我兴趣还...

【玩转 GPU】本地部署大模型--ChatGLM(尝鲜篇)

【玩转 GPU】本地部署大模型--ChatGLM(尝鲜篇)

本文主要介绍ChatGLM-6B 的本地部署,提供更保姆级别的教程,让完全不懂技术的同学,也能在本地部署大模型~在19年曾经尝试过使用GPT2进行代码补全,当时就被大模型效果惊艳到啊,只是没想到短短3...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。