使用Python实现网页中图片的批量下载和水印添加保存-敏敏张77-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

小白学大数据

首页　| 　博文目录　| 　关于我

博客访问： 199371
博文数量： 103
博客积分： 0
博客等级：民兵
技术积分： 1046
用户组：普通用户
注册时间： 2018-03-27 14:41

个人简介

宁为玉碎，不为瓦全

文章分类

全部博文（103）

未分配的博文（103）

文章存档

2025年（16）

2024年（31）

2023年（28）

2022年（17）

2021年（10）

2019年（1）

我的朋友

最近访客

推荐博文

相关博文

使用Python实现网页中图片的批量下载和水印添加保存

分类： Python/Ruby

2023-10-12 16:52:45

数字时代，图片已经成为我们生活中的一部分。无论是社交媒体上的照片，还是网页中的图片元素，我们都希望能够方便地下载并进行个性化的处理。

假设你是一位设计师，你经常需要从网页上下载大量的图片素材，并为这些图片添加水印以保护你的作品。然而，手动下载和添加水印是一件繁琐的事情，这时就可以通过编写一个Python爬虫程序，自动化地完成这个任务，节省时间和精力。

我们的基本思路是通过发送HTTP请求获取网页内容，然后解析网页内容，提取出图片元素的URL。接下来，我们使用请求库下载这些图片，并使用Pillow库添加水印。{BANNED}最佳后，我们将处理后面的图片保存到本地。

在开始之前，我们需要准备以下工作：

安装Python：确保您的计算机上已经安装了Python Spark语言的{BANNED}最佳新版本。
安装所需的库：我们将使用requests库来发送HTTP请求，PIL库来处理图片。你可以使用以下命令来安装这些库：

点击(此处)折叠或打开

pip install requests
pip install pillow

接下来，我们可以定义一个函数来发送HTTP请求并获取页面内容：

点击(此处)折叠或打开

def fetch_page(url):
proxies = {
"http": f"http://{proxyUser}:{proxyPass}@{proxyHost}:{proxyPort}",
"https": f"http://{proxyUser}:{proxyPass}@{proxyHost}:{proxyPort}"
}
response = requests.get(url, proxies=proxies)
return response.content

然后，我们可以编写一个函数来解析页面内容并提取图片元素的URL：

点击(此处)折叠或打开

from bs4 import BeautifulSoup
def extract_image_urls(page_content):
soup = BeautifulSoup(page_content, "html.parser")
image_urls = []
for img in soup.find_all("img"):
image_urls.append(img["src"])
return image_urls

接下来，我们可以编写一个函数来下载图片并添加水印：

点击(此处)折叠或打开

def download_and_add_watermark(image_url):
response = requests.get(image_url)
image = Image.open(BytesIO(response.content))
watermark = Image.new("RGBA", image.size, (0, 0, 0, 0))
draw = ImageDraw.Draw(watermark)
font = ImageFont.truetype("arial.ttf", 36)
draw.text((10, 10), "Watermark", font=font, fill=(255, 255, 255, 128))
watermarked_image = Image.alpha_composite(image.convert("RGBA"), watermark)
watermarked_image.save("watermarked_image.png")

实现完整代码

以下是完整的Python代码：

点击(此处)折叠或打开

import requests
from bs4 import BeautifulSoup
from PIL import Image, ImageDraw, ImageFont
from io import BytesIO
proxyHost = ""
proxyPort = "5445"
proxyUser = "16QMSOML"
proxyPass = "280651"
def fetch_page(url):
proxies = {
"http": f"http://{proxyUser}:{proxyPass}@{proxyHost}:{proxyPort}",
"https": f"http://{proxyUser}:{proxyPass}@{proxyHost}:{proxyPort}"
}
response = requests.get(url, proxies=proxies)
return response.content
def extract_image_urls(page_content):
soup = BeautifulSoup(page_content, "html.parser")
image_urls = []
for img in soup.find_all("img"):
image_urls.append(img["src"])
return image_urls
def download_and_add_watermark(image_url):
response = requests.get(image_url)
image = Image.open(BytesIO(response.content))
watermark = Image.new("RGBA", image.size, (0, 0, 0, 0))
draw = ImageDraw.Draw(watermark)
font = ImageFont.truetype("arial.ttf", 36)
draw.text((10, 10), "Watermark", font=font, fill=(255, 255, 255, 128))
watermarked_image = Image.alpha_composite(image.convert("RGBA"), watermark)
watermarked_image.save("watermarked_image.png")
def main():
# 获取网页的页面内容
page_content = fetch_page("")
# 提取图片元素的URL
image_urls = extract_image_urls(page_content)
# 下载图片并添加水印
for image_url in

阅读(512) | 评论(0) | 转发(0) |

0

上一篇：在Pyppeteer中实现反爬虫策略和数据保护

下一篇：使用 JDAudioCrawler 将下载的音频存储到本地存储

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们