文心一言并不是专业人工智能AI画图工具,专业画图请使用Midjourney,点击下方链接查看。


文心一言是百度发布的一款人工智能产品,对标OpenAI的ChatGPT和微软的新必应Bing

刚开完发布会,我就迫不及待的申请了内测资格,第二天就通过了。

但是最近头疼的一直没有专门测试一下,今天空下来试试到底如何,看看它的水平到底怎么样,当时发布会介绍了很多功能,比如文学作品、写小说、提纲、法律等等比较全面,这类网上的测试也特别多,最出名的是测成语绘图,虽然生成的画跟原本成语要表达的意思相去甚远,但是蛮有意思的。说了这么多,唯独没有介绍文心一言在计算机领域的关键能力,也就是编程能力到底如何,是骡子是马拉出来溜一圈见分晓。

我们今天让文心一言生成一段爬虫,爬取BOSS直聘年薪30万的互联网行业岗位信息,并且要求按字段存储到表格中:岗位名称、月薪、工时、是否双休、节假日福利、岗位要求、说明等,我们现在开始。

输入文字要求后,没怎么等待,直接生成了一个表格

跟我预期的爬虫还是差了好多,直接给我结果,连爬虫都省了

于是乎我不信邪,再点重新生成,看能生成个什么结果?

这次输出的结果还是相当不错的,比第一次好太多,看来第一次文心一言并没有拿出自己的真正实力,千呼万唤才能试出来,哈哈哈。

不得不说百度文心一言这个功能非常良心,让不懂编程的人,也可以毫无门槛在互联网中爬取自己所需要的数据,只要提供清楚你的需求,文心一言直接给你输出结果,完全零基础写爬虫。

还是不甘心,还是想让它生成爬虫,而不是直接输出结果,可能是我坐姿不对,调整下坐姿,让其输出.xlsx

我们看下结果,第一次又是在胡弄我,直到我了左下角的重新生成:

第二次生成的才是python爬虫,想要把文心一言用的顺手,必须点左下角重新生成,完全是两种输出结果。

所以大家在使用的时候,多点一下,输出结果会有不同收获,文心一言还有个最大的好处,比ChatGPT和新必应人性化的地方,当页面过期刷新后,上次的生成结果还能找回来,

在左侧列表的历史记录里面,点击一下,上次的生成结果又回来了。



下面我把生成的python爬虫代码分享出来,大家需要的自行复制:

python
# 爬取BOSS直聘年薪30万的互联网行业岗位信息,并且要求按字段存储到表格中  
from bs4 import BeautifulSoup  
def get_data():  
    url = "https://www.bosszhipin. com/jobs"  
    response, content = fetcher1(url)  
    soup = BeautifulSoup(content, 'html.parser')  
    table = soup.find("div", attrs={"class": "job-listing clearfix oddEvenClear nowrap"})  
    if not table:  
        print(f"No results found for {input[0]}")  
        return None  
    else:  
        rows = table.findAll("tr")  
        cols = []  
        for row in rows:  
            cells = row.findAll(text=True)  
            cols.extend(cells)  
        data = {  
            "name": [  
                item.string.strip() for item in cells if item.string is not None  
            ],  
            "salary": sum(float(c.contents[1:3])) / 12,  
            "hours": len(cells),  
            "daysOfWeekSunday": str(  
                (int(cell.string.strip()) + 6 - 5 * 2 ** 14 // 7) % 7 + 1  
            ),  
            "holidayHolidayListingDaysRentalsFeeSalaryDayOffFinancialYearlyPayUpfrontIncomeTaxTotalAmount