2023 年 7 月 – Jiang's blog —— 姜来的个人记录

基于Paddlenlp多模态预训练模型document_intelligence的图片内容识别以及云GPU服务器部署运行

2023-7-28 16:22

|

0

|

275

1176 字

|

5 分钟

前不久正在做某平台上城市规划项目相关数据的抓取，发现此类数据不满足传统爬虫所需的格式化要求，批量爬取的难度较大。于是转换思路，先通过截取所有项目页面的图片，并保存到本地。然后利用百度的开源模型Paddlenlp对图片内容进行识别。由于数据量大，而且我的RTX2060显卡跑这种大型推理模型稍显吃力，还是把数据和代码部署到云GPU服务器慢慢跑吧。 Pa…

机器学习深度学习计算机技术

“数字孪生、图灵测试和城市模型”——Michael Batty院士讲座

2023-7-17 16:27

|

0

|

241

2025 字

|

8 分钟

前言前段时间有幸听了一场2023全球数字经济大会“数字孪生城市与数智治理创新”专题论坛，其中对Michael Batty院士关于数字孪生城市的讲座印象较为深刻，打破了我的一些固有认知，也产生了对城市模型的新想法和新认知。写这篇博客，一是为了梳理所学的内容，二是为了重新认识数字孪生、城市模型等含义。 Michael Batty（迈克尔·巴蒂）院士，…

城乡规划城市模型数字孪生智慧城市

通过Pillow库实现图片按比例剪裁以及tqdm库可视化运行进程

2023-7-17 15:13

|

0

|

90

355 字

|

2 分钟

最近在利用paddle的开源模型实现对图片内容的推理。但是由于部分图片过大，导致识别精度下降。根据初步实验结果，发现图片中后部分的信息都没有用，于是想到用Pillow库对图片进行裁剪，从而降低图片大小。导入Pillow库及其他相关库 from PIL import Imageimport osimport globfrom tqdm import…

Python技术数据批量处理计算机技术

月度归档： 2023 年 7 月