# 收藏好项目 **Repository Path**: zhangyy130/collect-items ## Basic Information - **Project Name**: 收藏好项目 - **Description**: 收藏一些个人觉得有用、有意思的项目 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 8 - **Created**: 2024-05-16 - **Last Updated**: 2024-05-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 收藏一些个人感觉有用的项目 1、[cherry](https://github.com/Windsooon/cherry) 简单易用的文本分类器。适用多种语言,自带两个预训练模型,使用预训练模型进行分类只需一行代码。使用自己的数据集进行定制训练也只需要十行代码。轻松达到高精确率,召回率。同时该库支持自定义分词算法、分类算法等。示例代码: ``` >>> res = cherry.classify(model='harmful', text=['她们对计算机很有热情,也希望学习到数据分析,网络爬虫,人工智能等方面的知识,从而运用在她们工作上']) >>> res.word_list [(2, '她们'), (1, '网络'), (1, '热情'), (1, '方面'), (1, '数据分析'), (1, '希望'), (1, '工作'), (1, '学习'), (1, '从而')] >>> res.probability # 返回结果分别对应 赌博,正常,政治,色情 4个 类别的概率 array([[4.43336608e-03, 9.95215198e-01, 3.51419231e-04, 1.68657851e-08]]) ``` 2、[ChineseNLPCorpus](https://github.com/InsaneLife/ChineseNLPCorpus) 中文自然语言处理数据集(含实例) 3、[dimensionality_reduction_alo_codes](https://github.com/heucoder/dimensionality_reduction_alo_codes) 该项目使用 Python 实现了 11 种经典的数据抽取(数据降维)算法。同时附有相关资料、展示效果,适用于机器学习初学者和刚刚入坑数据挖掘的小伙伴 4、[RPA-Python](https://github.com/tebelorg/RPA-Python) 一个 Python 自动化操作的库。 5、[funNLP](https://github.com/fighting41love/funNLP) 中文词库的集合。几乎最全的中文NLP资源库,可用于:敏感词、语言检测、拆字词典等 | * [语料库](https://github.com/fighting41love/funNLP#语料库) * [词库及词法工具](https://github.com/fighting41love/funNLP#词库及词法工具) * [预训练语言模型](https://github.com/fighting41love/funNLP#预训练语言模型) * [抽取](https://github.com/fighting41love/funNLP#抽取) * [知识图谱](https://github.com/fighting41love/funNLP#知识图谱) * [文本生成](https://github.com/fighting41love/funNLP#文本生成) * [文本摘要](https://github.com/fighting41love/funNLP#文本摘要) * [智能问答](https://github.com/fighting41love/funNLP#智能问答) * [文本纠错](https://github.com/fighting41love/funNLP#文本纠错) | * [文档处理](https://github.com/fighting41love/funNLP#文档处理) * [表格处理](https://github.com/fighting41love/funNLP#表格处理) * [文本匹配](https://github.com/fighting41love/funNLP#文本匹配) * [文本数据增强](https://github.com/fighting41love/funNLP#文本数据增强) * [文本检索](https://github.com/fighting41love/funNLP#文本检索) * [阅读理解](https://github.com/fighting41love/funNLP#阅读理解) * [情感分析](https://github.com/fighting41love/funNLP#情感分析) * [常用正则表达式](https://github.com/fighting41love/funNLP#常用正则表达式) * [语音处理](https://github.com/fighting41love/funNLP#语音处理) | | ------------------------------------------------------------ | ------------------------------------------------------------ | | * [常用正则表达式](https://github.com/fighting41love/funNLP#常用正则表达式) * [事件抽取](https://github.com/fighting41love/funNLP#事件抽取) * [机器翻译](https://github.com/fighting41love/funNLP#机器翻译) * [数字转换](https://github.com/fighting41love/funNLP#数字转换) * [指代消解](https://github.com/fighting41love/funNLP#指代消解) * [文本聚类](https://github.com/fighting41love/funNLP#文本聚类) * [文本分类](https://github.com/fighting41love/funNLP#文本分类) * [知识推理](https://github.com/fighting41love/funNLP#知识推理) * [可解释NLP](https://github.com/fighting41love/funNLP#可解释自然语言处理) * [文本对抗攻击](https://github.com/fighting41love/funNLP#文本对抗攻击) | * [文本可视化](https://github.com/fighting41love/funNLP#文本可视化) * [文本标注工具](https://github.com/fighting41love/funNLP#文本标注工具) * [综合工具](https://github.com/fighting41love/funNLP#综合工具) * [有趣搞笑工具](https://github.com/fighting41love/funNLP#有趣搞笑工具) * [课程报告面试等](https://github.com/fighting41love/funNLP#课程报告面试等) * [比赛](https://github.com/fighting41love/funNLP#比赛) * [金融NLP](https://github.com/fighting41love/funNLP#金融自然语言处理) * [医疗NLP](https://github.com/fighting41love/funNLP#医疗自然语言处理) * [法律NLP](https://github.com/fighting41love/funNLP#法律自然语言处理) * [文本生成图像](https://github.com/fighting41love/funNLP#文本生成图像) * [其他](https://github.com/fighting41love/funNLP#其他) | 6、[PythonPlantsVsZombies](https://github.com/marblexu/PythonPlantsVsZombies) Python 语言编写的植物大战僵尸。学习如何使用 Python 编写小游戏的极佳例子 7、[PySimpleGUI](https://github.com/PySimpleGUI/PySimpleGUI) Python GUI 编程库,它是将 tkinter、Qt、Remi、WxPython 封装成更人性化的接口。 ``` import PySimpleGUI as sg sg.theme('DarkAmber') # 设置主题颜色 # 界面内包含的东西 layout = [ [sg.Text('Some text on Row 1')], [sg.Text('Enter something on Row 2'), sg.InputText()], [sg.Button('Ok'), sg.Button('Cancel')] ] # 创建窗口 window = sg.Window('Window Title', layout) # 监听事件 while True: event, values = window.read() if event in (None, 'Cancel'): # 用户点击取消按钮事件 break print('You entered ', values[0]) window.close() ``` 8、[mitmproxy](https://github.com/mitmproxy/mitmproxy) 基于 Python 语言开发的抓包工具。支持命令行、Web 平台的形式展示抓包结果,还能通过 Python 引用库来拦截、控制响应和请求。 9、[KeymouseGo](https://github.com/taojy123/KeymouseGo) Python 实现的精简绿色版按键精灵。记录用户的鼠标、键盘操作,自动执行之前记录的操作,可设定执行的次数。在进行某些简单、单调重复的操作时,使用该软件可以十分省事儿。只需要录制一遍,剩下的交给 KeymouseGo 来做就可以了 10、[vaex](https://github.com/vaexio/vaex) 类似 Pandas 的 Python 数据处理库,在处理大型数据集的时候表现极大的优于 Pandas。Vaex 通过懒加载、延迟计算和零内存复制策略,极大的降低了内存的使用率、提高了计算的效率。从而能够每秒处理 10 亿行的数据,并且支持以直方图、密度图等形式展示数据 11、[word_cloud](https://github.com/amueller/word_cloud) Python 的词云生成工具。 12、[faceai](https://github.com/vipstone/faceai) 一款优秀入门级 AI 项目以及教程,内容涵盖:人脸、视频、文字的检测和识别。他不仅包含最基本的人脸检测、识别(图片、视频)、轮廓标识、头像合成(给人戴帽子),还有表情识别(生气、厌恶、恐惧等)、视频对象提取、图片修复(可用于水印去除)、图片自动上色等等。推荐这个开源项目不是因为它的内容强大,而是它的教程写的实在太好了,真 · 入门级。手把手教你如何使用这个项目,做出上述功能来。在每篇功能文章的教程里,不仅仅写了每个功能的技术实现方案,还有具体重点关键代码的注释和解释以及具体实现,让你非常轻松的能够看懂、学习和使用。 13、[wttr.in](https://github.com/chubin/wttr.in) 一个 Python 实现的命令行查看天气工具 14、[activitywatch](https://github.com/ActivityWatch/activitywatch) 一个记录你的时间都花在那的 Python 项目。支持 Web 可视化 15、[akshare](https://github.com/akfamily/akshare) 一款基于 Python 的开源金融数据接口库。提供了股票、期货、期权、基金、数字货币等金融产品的基本数据、实时和历史行情数据、衍生数据,包含数据采集、数据清洗、到数据落地的一套开源工具。满足了金融数据科学家、数据科学爱好者在金融数据获取方面的需求。 16、[OnlineToolsBook](https://github.com/zhaoolee/OnlineToolsBook) 该项目收集了一些有趣、实用的在线工具网站,点开即用 17、[falcon](https://github.com/plotly/falcon) 一款免费、开源的 SQL 可视化编辑器,具有查询数据、可视化等功能。 支持 Windows、Mac、Linux 操作系统,能够链接 MySQL、PostgreSQL、SQLite 等多种数据库,并把查询结果通过不同形式图表展示。 18、[zfile](https://github.com/zfile-dev/zfile) 免费开源的在线云盘项目。功能特性: - 文件夹密码 - 支持在线浏览文本文件、视频、图片、音乐 - 文件/目录二维码 - 全局搜索 - 等等 19、[fastapi](https://github.com/tiangolo/fastapi) 基于 Python 3.6+ 的高性能 Web 框架。“人如其名”用 FastAPI 写接口那叫一个快、调试方便,Python 在进步而它基于这些进步,让 Web 开发变得更快、更强。 ``` from fastapi import FastAPI app = FastAPI() @app.get("/") async def read_root(): return {"Hello": "World"} @app.get("/items/{item_id}") async def read_item(item_id: int, q: str = None): return {"item_id": item_id, "q": q} # 启动命令:uvicorn main:app --reload ``` 20、[scikit-opt](https://github.com/guofei9987/scikit-opt) 一个封装了 7 种启发式算法的 Python 代码库。分别是:差分进化算法、遗传算法、粒子群算法、模拟退火算法、蚁群算法、鱼群算法、免疫优化算法 21、[altair](https://github.com/altair-viz/altair) 强大的数据可视化 Python 库。支持多种数据展示方式、接口简单、效果炫酷 22、[QuickCut](https://github.com/HaujetZhao/QuickCut) 一款轻量、好用的开源视频处理工具。它是基于 PyQt5 开发的桌面工具,用于满足非专业用户的视频处理需求:压缩视频、转码视频、倒放视频、合并片段、根据字幕裁切片段、自动配字幕、自动剪辑等 ![QuickCut](https://img.hellogithub.com/i/Oug6AQWocsmqN39.png) 23、[cnn-convoluter](https://github.com/pwwang/cnn-convoluter) 一个支持交互的展示卷积过程的可视化工具 ![cnn-convoluter](https://img.hellogithub.com/i/zSZe8TqH31aIYXU.gif) 24、[waifu2x](https://github.com/nagadomi/waifu2x) 基于机器学习把图片、照片变得高清。该项目使用卷积神经网络对图片进行 1-2 倍的无损放大操作,支持降噪保证图片质量。[在线尝试](http://waifu2x.udp.jp/) ![waifu2x](https://img.hellogithub.com/i/U6HCWSXYzo2eDuc.png) 25、[seq2seq-couplet](https://github.com/wb14123/seq2seq-couplet) 基于深度学习的对对联项目,你出上联它自动生成下联。[在线尝试](https://ai.binwang.me/couplet/) 26、[video-object-removal](https://github.com/zllrunning/video-object-removal) 通过 Pytorch 实现绘制一个边界框,即可删除视频中要删除的对象。下图是演示操作,框中红色是抹掉的部分,删除前后的效果对比图可进到项目首页查看 ![video-object-removal](https://img.hellogithub.com/i/f5gwqRMrujLNAib.gif) 27、[snownlp](https://github.com/isnowfy/snownlp) 一个 Python 写的自然语言处理库。使用简单、功能强大,支持中文分词、词性标注、情感分析等 ``` from snownlp import SnowNLP s = SnowNLP(u'这个东西真心很赞') s.words # [u'这个', u'东西', u'真心', # u'很', u'赞'] s.tags # [(u'这个', u'r'), (u'东西', u'n'), # (u'真心', u'd'), (u'很', u'd'), # (u'赞', u'Vg')] s.sentiments # 0.9769663402895832 positive的概率 ``` 28、[python-cheatsheet](https://github.com/gto76/python-cheatsheet) 全面且实用的 Python 备忘录。这个东西特别适合我这个上了年纪的人,比如:忘记怎么用 Python 写正则、要搞个进度条忘记库的名字和基本用法、用 pandas 处理数据忘记方法需要的参数等等。 29、[EasyOCR](https://github.com/JaidedAI/EasyOCR) 支持多种语言的即用型的 Python OCR 库,包括中文、日文、韩文等。 30、[python-patterns](https://github.com/faif/python-patterns) Python 设计模式和使用场景的集合 31、[pulse](https://github.com/adamian98/pulse) 根据包含马赛克的人脸图像,生成一张相似容貌的结果。注意不是复原哦,仅可用于人脸 ![pulse](https://img.hellogithub.com/i/BMxP8yLEt3iXjz7.gif) 32、[mochat](https://github.com/mochat-cloud/mochat) 一套开源的企业微信开发框架和管理系统。基于 PHP 开发的前后端分离、功能强大的企业微信管理平台 33、[dbeaver](https://github.com/dbeaver/dbeaver) 支持主流数据库的桌面管理工具。一款用 Java 写的数据库管理工具,只要是 JDBC 支持的数据库它都支持。虽然分免费社区版和付费企业版,但是免费的功能其实已经够用啦 ![dbeaver](https://img.hellogithub.com/i/OAtJZRMwF0WqXGI.png) 34、[PyG2Plot](https://github.com/hustcc/PyG2Plot) 基于 G2Plot 封装的 Python3 可视化库。G2Plot 是蚂蚁集团开源的一个基于图表分类学的可视分析图表库,内置 25+ 常见图表类型。该库是 Python 对 G2Plot 的封装,体验良好,开箱即用 ![PyG2Plot](https://img.hellogithub.com/i/qD4YFNcHta8BVZ9.png) 35、[blind_watermark](https://github.com/guofei9987/blind_watermark) 给图片加盲水印的 Python 库。盲水印就是图片有水印但人眼看不出来,需要通过程序才能提取水印,相当于隐形“盖章”,可以用在数据泄露溯源、版权保护等场景。该库出自阿里巴巴安全团队,强大之处: - 解析水印图时无需原图 - 水印图剪裁、旋转都不会破坏图中的盲水印 - 支持密码加密 ``` from blind_watermark import WaterMark bwm_obj = WaterMark(password_wm=1, password_img=1) # 原图 bwm_obj.read_img('pic/原图.jpg') # 水印图 bwm_obj.read_wm('pic/水印.png') # 打水印后的图 bwm_obj.embed('output/结果.png') # 注意需要设定水印的长宽 wm_shape bwm_objextract(filename='output/结果.png', wm_shape=(120, 120), out_wm_name='output/解出的水印.png', ) ``` 36、[requests-html](https://github.com/psf/requests-html) 好用的 Python 解析 HTML 库。写爬虫的小伙伴都感受过解析 HTML 的痛苦,常用工具 BeautifulSoup、lxml、Scrapy 的 selector 等。今天你有了新的选择 requests-html,支持 XPath、CSS 选择器、动态页面、过滤指定内容等。上手特别简单和迅速,我的爬虫项目 [Hydra](https://github.com/HelloGitHub-Team/Hydra) 中就用了它,解析 HTML 变得轻松了许多。 37、[Serial-Studio](https://github.com/Serial-Studio/Serial-Studio) 一款 C++ 写的数据可视化桌面工具。支持多平台 ![Serial-Studio](https://img.hellogithub.com/i/s9qeLu0KG4kP3JH.gif) 38、[lux](https://github.com/lux-org/lux) 一个用于数据科学方面的 Python 开源库。这个库适用于实验室分析数据的场景,基于 Jupyter 的数据可视化和操作界面,再加上 pandas 丰富的数据接入方式以及强大的数据处理能力,让数据的分析变得简单从而可以更加直观地找到数据背后藏着的“真理” ![lux](https://img.hellogithub.com/i/kNLARF3mzYp2HVD.gif) 39、[Airtest](https://github.com/AirtestProject/Airtest) 适用于移动端应用的跨平台 UI 自动化框架。基于图像识别定位元素,可能都不需要一行代码就可以很方便地用它来测试 APP 或刷游戏 ![Airtest](https://img.hellogithub.com/i/5ogkP1O3zCYGKQJ.gif) 40、[azuredatastudio](https://github.com/microsoft/azuredatastudio) 微软开源的数据库桌面管理工具。该工具支持 SQL Server、Azure SQL DB 和 SQL DW 数据库,Windows 下的安装包仅不到 100 MB,还支持另外两大操作系统 macOS 和 Linux。 ![azuredatastudio](https://img.hellogithub.com/i/lnVDYG2eFKgi6X0.jpeg) 41、[Paddle](https://github.com/PaddlePaddle/Paddle) 百度开源的深度学习框架。开发便捷的产业级深度学习框架,支持千亿特征、万亿参数、数百节点的大规模训练。官方还为用户提供了免费的算力可用于学习和训练,社区活跃教程齐全对新手友好 42、[best-of-ml-python](https://github.com/ml-tooling/best-of-ml-python) 优秀的 Python 机器学习相关开源库集合。该项目会根据收录的开源项目各项指标计算得出一个评分,并定期更新 43、[OpenRefine](https://github.com/OpenRefine/OpenRefine) 一款用于清理数据的桌面工具。通过可视化的方式分析、整理数据,支持 Windows、Linux、Mac 操作系统。拥有查询、过滤、去重、分析等功能,可以把杂乱的数据变成“整洁”的电子表格,还能够将结果导出成多种格式的文件。不会编程和 SQL 的小伙伴们,也可以轻松分析海量数据啦! ![OpenRefine](https://img.hellogithub.com/i/kwB0JXVeuCg1vfs.png) 44、[nav](https://github.com/xjh22222228/nav) 一个支持 SEO 的静态导航网站。不依赖后端的纯前端项目开箱即用,简单清爽 ![nav](https://img.hellogithub.com/i/f8bZL6J5PsBEwq4.png) 45、[LIII](https://github.com/aliakseis/LIII) 免费开源的 BT 下载工具。如果你厌倦了广告、购买 VIP 才能提速,只想要一个简单好用的下载工具,那你可以试试这个开源项目 ![LIII](https://img.hellogithub.com/i/cQHX6f42lzD3PTa.png) 46、[rustdesk](https://github.com/rustdesk/rustdesk) 免费开源的远程桌面软件。开箱即用无需任何配置,支持 Linux/Mac/Win/Android 等平台。还能够自行搭建服务器,由用户自己掌控数据,不必担心隐私数据泄露的问题。在当下越来越多的远程桌面软件都收费的情况下的另一个选择 ![rustdesk](https://img.hellogithub.com/i/F0KwatcIpixy2Qd.png) 47、[Real-Time-Voice-Cloning](https://github.com/CorentinJ/Real-Time-Voice-Cloning) 克隆某个人说话声音的 AI 项目。仅需几秒音频,就能模仿出原音频的人声 ![Real-Time-Voice-Cloning](https://img.hellogithub.com/i/TsKrAjZyH51Gg8p.jpg) 48、[bigdata_analyse](https://github.com/TurboWay/bigdata_analyse) 大数据分析实战项目的集合。该项目包含了淘宝、租房、招聘等数据的分析实例,不仅有 Python、SQL、HQL 的实例代码,还附上了数据集下载地址。 ![bigdata_analyse](https://img.hellogithub.com/i/VBFgzAsQKGPjetX.png) 49、[tqsdk-python](https://github.com/shinnytech/tqsdk-python) 开源的 Python 量化交易框架。使用少量代码即可实现量化交易程序,还支持历史数据、实时数据、策略回测、实盘交易、图形化界面展示等功能。但免费版本仅提供全部的期货、商品/金融期权和上证50、沪深300 和中证500 的实时行情,付费版支持更多种类以及更加稳定的服务 ``` from tqsdk import TqApi, TqAuth, TqAccount, TargetPosTask api = TqApi(TqAccount("H海通期货", "4003242", "123456"), auth=TqAuth("信易账户", "账户密码")) # 创建 TqApi 实例, 指定交易账户 q_1910 = api.get_quote("SHFE.rb1910") # 订阅近月合约行情 t_1910 = TargetPosTask(api, "SHFE.rb1910") # 创建近月合约调仓工具 q_2001 = api.get_quote("SHFE.rb2001") # 订阅远月合约行情 t_2001 = TargetPosTask(api, "SHFE.rb2001") # 创建远月合约调仓工具 while True: api.wait_update() # 等待数据更新 spread = q_1910.last_price - q_2001.last_price # 计算近月合约-远月合约价差 print("当前价差:", spread) if spread > 250: print("价差过高: 空近月,多远月") t_1910.set_target_volume(-1) # 要求把1910合约调整为空头1手 t_2001.set_target_volume(1) # 要求把2001合约调整为多头1手 elif spread < 200: print("价差回复: 清空持仓") # 要求把 1910 和 2001合约都调整为不持仓 t_1910.set_target_volume(0) t_2001.set_target_volume(0) ``` 50、[ray](https://github.com/ray-project/ray) 基于 Python 的分布式计算框架,采用动态图计算模型。使用起来很方便可通过装饰器的方式,仅需修改极少的的代码,让原本运行在单机的 Python 代码轻松实现分布式计算。目前多用于机器学习方面 51、[moviepy](https://github.com/Zulko/moviepy) 用于处理视频的 Python 库,它支持视频剪辑、自定义效果、视频合成、格式转化、插入文字等功能。专于注视频但不局限于此,还支持处理音频和 GIF 图片。虽然现在视频剪辑的工具很丰富,但如果要批量处理视频,用 Python+moviepy 写个脚本应该可以一劳永逸,节省时间 ![moviepy](https://img.hellogithub.com/i/vsPS6dqem8DQALa.jpeg) 52、[chineseocr_lite](https://github.com/DayBreak-u/chineseocr_lite) 轻量级中文 OCR 项目 ![chineseocr_lite](https://img.hellogithub.com/i/GrCmhlqWLSycY6p.png) 53、[ASRT_SpeechRecognition](https://github.com/nl8590687/ASRT_SpeechRecognition) 基于深度学习的中文语音识别系统 54、[video-srt-windows](https://github.com/wxbool/video-srt-windows) 自动识别视频语音生成字幕文件的工具。采用 Go+walk 开发所以仅支持 Windows 系统,原理是请求在线语音转文字的服务,超出免费额度需付费。另外还加入了导出字幕文件和翻译功能 ![video-srt-windows](https://img.hellogithub.com/i/6kzeBNsRpYtSToO.gif) 56、[Tkinter-Designer](https://github.com/ParthJadhav/Tkinter-Designer) 用拖动的方式创建漂亮的桌面软件。它的操作十分简单,首先在 Figma 网站通过拖拽的方式构建应用,然后把设计好的应用地址和 token 输入到 Tkinter-Designer 自动生成 Python 代码,最后就能得到界面简洁大方的桌面应用啦。不用代码做出基于 tkinter 的桌面应用 ![Tkinter-Designer](https://img.hellogithub.com/i/nPDjsRQUofcrxYV.png) 57、[git-cheat-sheet](https://github.com/arslanbilal/git-cheat-sheet) Git 备忘录。该项目不仅对 Git 常用命令做了分类展示,还有 Git 工作流的讲解,能够帮助新手快速上手 Git。[中文版](https://github.com/flyhigher139/Git-Cheat-Sheet) 58、[Real-ESRGAN](https://github.com/xinntao/Real-ESRGAN) 图像超分辨率模型,修复漫画图像的效果惊艳。通过 AI 技术将低分辨率、模糊的图像修复成高清图像,可用于图像放大和提升质量。基于它实现的[桌面工具](https://github.com/X-Lucifer/AI-Lossless-Zoomer),还有可以直接使用的 Python 脚本,快去试试效果吧 ![Real-ESRGAN](https://img.hellogithub.com/i/OuBMvSFwm7TIoPq.gif) 59、[qlib](https://github.com/microsoft/qlib) 微软开源的 AI 量化交易平台。它包含了数据处理、模型训练、回测等模块,涵盖了 Alpha 挖掘、风险建模、组合优化等功能 ![qlib](https://img.hellogithub.com/i/dJ4V1fE87SQHP2p.png) 60、[optuna](https://github.com/optuna/optuna) 专为机器学习准备的超参数优化框架。采用高效的采样和剪枝策略,支持简单的 Python 语法,仅需少量代码便可进行分布式计算加速优化,除此之外还有更为直观的可视化页面。全方位帮你调参,自动找到最优参数 ![optuna](https://img.hellogithub.com/i/uH61Djw4PIYep5b.gif) 61、[automa](https://github.com/AutomaApp/automa) 通过图形化界面拖拽功能模块,实现浏览器自动操作的扩展工具。轻松实现自动填表、截图、定时执行等操作。让浏览器自动完成预设工作流的插件,从而减少重复性操作提高效率 62、[PyWebIO](https://github.com/pywebio/PyWebIO) 快速构建 Web 应用的 Python 工具。通过该项目你可在不写 HTML、CSS、JS 代码的前提下,仅用 Python 快速完成一个包含数据展示、表单的小型 Web 应用页面 ![PyWebIO](https://img.hellogithub.com/i/a5oOxTW37IE0lJ9.gif) 63、[pottery](https://github.com/brainix/pottery) 以 Python 的方式操作 Redis 的库。忘记那些 Redis 命令吧,只要你知道如何使用 Python 字典,那么你就会用这个库操作 Redis 64、[PathPlanning](https://github.com/zhm-real/PathPlanning) 常见的路径规划算法集合。项目包含了 Python 代码实现、运行过程动画以及相关论文 ![PathPlanning](https://img.hellogithub.com/i/GWNSUIfEKryHL4l.gif) 65、[PowerRemoteDesktop](https://github.com/DarkCoderSc/PowerRemoteDesktop) 仅用 PowerShell 实现的远程桌面工具。它易于安装和使用、功能齐全,未依赖现有的协议和工具 66、[mometa](https://github.com/imcuttle/mometa) 前端代码可视化编辑器。一款低代码辅助开发的工具,可通过拖拽的方式构建和编辑页面。特性: - 🛠 直接作用于源码,支持移动端布局 - 🍒 开放物料生态,可定制团队内物料库 - 🌟 无缝兼容接入,不破坏已有项目开发模式 ![mometa](https://img.hellogithub.com/i/M0lBzptenrOaS9c.png) 67、[one-html-page-challenge](https://github.com/Metroxe/one-html-page-challenge) 单个 HTML 页面的挑战。该项目汇集了满足仅有一个 HTML 文件、小于 1MB、不可接入 API、不能引用库条件下实现的创意网页。[在线查看](https://onehtmlpagechallenge.com/) ![one-html-page-challenge](https://img.hellogithub.com/i/sE6XqHBZnSbjW0C.png) 68、[python-mini-projects](https://github.com/Python-World/python-mini-projects) 一个简单的 Python 迷你脚本集合。虽然代码简单但其中不乏实用的 Python 脚本,比如图片添加水印、批量下载图片、发送电子邮件、定时截屏等 69、[tstock](https://github.com/Gbox4/tstock) 在命令行看股票走势的工具 ![tstock](https://img.hellogithub.com/i/RF24LW6fg8BmDqt.png) 70、[Python](https://github.com/TheAlgorithms/Python) 用 Python 实现所有算法。该项目是用 Python 语言实现各种算法的集合,主要用于教育和学习。包括搜索、排序、数据结构、机器学习、密码、神经网络等方面 71、[Monitorian](https://github.com/emoacht/Monitorian) 轻松调节多个显示器亮度的 Windows 桌面工具。操作界面支持中文,使用时显示器需要开启 DDC/CI 72、[rembg](https://github.com/danielgatis/rembg) 简单实用的删除图像背景/抠图工具 ``` from rembg import remove from PIL import Image input_path = 'input.png' output_path = 'output.png' input = Image.open(input_path) output = remove(input) output.save(output_path) ``` ![rembg](https://img.hellogithub.com/i/zDiqy7FJLbm0oWx.png) 73、[textdistance](https://github.com/life4/textdistance) 计算文本距离的常用算法库。包含计算文本相似度、多样性、编辑距离、压缩等多种算法,所有算法均采用 Python 实现,容易理解调用方便 ``` import textdistance textdistance.hamming.normalized_similarity('test', 'text') # 相似度为 0.75 ``` 74、[design-patterns-for-humans](https://github.com/kamranahmedse/design-patterns-for-humans) 人人都能看懂的设计模式教程。[中文](https://github.com/guanguans/design-patterns-for-humans-cn) 75、[rubiks-cube](https://github.com/pengfeiw/rubiks-cube) 使用 Three.js 制作的 3D 魔方。支持自定义魔方阶数,[在线尝试](https://pengfeiw.github.io/minicode/threejs-rubik) 76、[modin](https://github.com/modin-project/modin) 更快、类似 pandas 的数据处理和分析库。底层通过 Ray 或 Dask 加速计算,上层兼容大部分 pandas API。所以使用起来十分简单,仅需更改一行代码即可从 pandas 无缝切换到 Modin,同时获得更快的数据处理速度 ``` # import pandas as pd import modin.pandas as pd import numpy as np frame_data = np.random.randint(0, 100, size=(2**10, 2**8)) df = pd.DataFrame(frame_data) ``` ![modin](https://img.hellogithub.com/i/ZI8WsVnp7wa3rDb.png) 77、[pikepdf](https://github.com/pikepdf/pikepdf) 用于读取和写入 PDF 文件的 Python 库 ``` import pikepdf with pikepdf.open('input.pdf') as pdf: num_pages = len(pdf.pages) del pdf.pages[-1] pdf.save('output.pdf') ``` ![pikepdf](https://img.hellogithub.com/i/61MTxYrPEGCVOaZ.png) 78、[WechatMomentScreenshot](https://github.com/TransparentLC/WechatMomentScreenshot) 朋友圈截图生成工具 ![WechatMomentScreenshot](https://img.hellogithub.com/i/HeuLn3dZVEpAqFQ.png) 79、[FreeRDP](https://github.com/FreeRDP/FreeRDP) 完全免费的远程桌面管理工具。此项目为远程桌面协议(RDP)的一个开源实现,通过它可以轻松实现 macOS 或 Linux 远程操作 Windows 桌面系统反之亦可,使用起来十分方便和流畅。[下载地址](https://github.com/FreeRDP/FreeRDP/wiki/PreBuilds) ![FreeRDP](https://img.hellogithub.com/i/JKYUhz2kE1QXMFS.png) 80、[WantWords](https://github.com/thunlp/WantWords) 拯救词穷的字典。由清华大学 NLP 实验室开源,可以根据你的意思返回相关词汇,有效解决词穷、话到嘴边说不出来的窘境。[在线尝试](https://wantwords.net/) 81、[machine_learning_complete](https://github.com/Nyandwi/machine_learning_complete) 全面的机器学习教程库。一份包含 30 多个 Jupyter Notebook 的集合库,内容涵盖机器学习所需的 Python 基础,数据操作、清洗、分析、可视化常用的库和工具,以及经典机器学习、NLP、计算机视觉等算法,一份面面俱到的机器学习入门教程 82、[nonebot2](https://github.com/nonebot/nonebot2) Python 异步聊天机器人框架。该项目基于 Python 的异步特性,可以轻松处理大量的消息。提供命令行脚手架、支持多种 IM 平台,能够快速构建聊天机器人、消息通知等项目。 83、[DearPyGui](https://github.com/hoffstadt/DearPyGui) 强大的 Python GUI 库。底层采用 GPU 渲染提供了卓越的性能,内置多种现成的部件和样式控制,文档详细包含丰富的示例,可以轻松上手。 84、[checkchan-dist](https://github.com/easychen/checkchan-dist) 网页内容监控工具。能监测网页内容变化,并发送异动通知,可用来跟踪网站内容、追番剧和小说。 ![checkchan-dist](https://img.hellogithub.com/i/Gb8Hq7FxXEAsgUI_1656256002.png) 85、[pandas-profiling](https://github.com/ydataai/pandas-profiling) 能够自动生成 pandas DataFrame 分析报告的库。虽然 pandas 自带的 df.describe 函数可以方便地生成统计报告,但是信息较少。该项目能够自动生成一份 df 多维度的 HTML 分析报告,包含列的类型、缺失情况、数值分布、行重复率、占用内存大小等信息,有助于更好地了解数据情况。 86、[Publii](https://github.com/GetPublii/Publii) 带 GUI 的静态网站生成工具。一款本地的静态网站 CMS 工具,有了它无需编程基础,即可通过图形化界面,轻松地创建个人博客、企业官网等,还支持一键发布到 GitHub Page、GitLab、Netlify 等网站。 87、[paper2gui](https://github.com/Baiyuetribe/paper2gui) 面向非编程人员的 AI 应用工具箱。该项目提供了多款免安装下载即用的 AI 工具,功能涵盖语音合成、视频补帧、图像风格转化、目标检测、OCR 识别等方面,让编程小白也能轻松拥有 AI “魔法”。 ![paper2gui](https://img.hellogithub.com/i/qiNdnr7YVJLRxFU_1658913365.png) 88、[m3u8-downloader](https://github.com/Momo707577045/m3u8-downloader) m3u8 视频在线提取工具。m3u8 视频格式常用于直播服务,其原理是将完整的视频拆分成多个 .ts 视频碎片,其中 .m3u8 文件会详细记录每个视频片段的地址。视频播放时,会先读取 .m3u8 文件,再逐个下载播放 .ts 视频片段。该项目就是基于上述原理实现的 m3u8 视频提取工具,使用方便无需安装打开网页即可下载完整的视频。 89、[Games](https://github.com/CharlesPikachu/Games) 纯 Python 实现的桌面小游戏集合。该项目包含 20 多个不重样的趣味小游戏,它们都是采用 Python 开发运行简单,用到的库包括 cocos2d、pygame、PyQt 等。虽然这些游戏可玩性较低,但项目简单十分适合新手学习。 90、[stable-diffusion](https://github.com/CompVis/stable-diffusion) 可以根据文字生成图片的模型。只要输入一段文字描述,就能得到一张由 AI 生成的图片,除此之外该项目还支持将粗糙的草图转化成精致的艺术图片。 ``` # make sure you're logged in with `huggingface-cli login` from torch import autocast from diffusers import StableDiffusionPipeline pipe = StableDiffusionPipeline.from_pretrained( "CompVis/stable-diffusion-v1-4", use_auth_token=True ).to("cuda") prompt = "a photo of an astronaut riding a horse on mars" with autocast("cuda"): image = pipe(prompt)["sample"][0] image.save("astronaut_rides_horse.png") ``` ![stable-diffusion](https://img.hellogithub.com/i/bsPvm6jedTCyVoQ_1664266774.png) 91、[min](https://github.com/minbrowser/min) 一款最小化的浏览器。它是仅包含搜索、书签、密码管理、广告屏蔽器等最基础功能的极简浏览器,适用于 Windows、Linux、macOS 操作系统。 ![min](https://img.hellogithub.com/i/6Hkz8glNaBTsXqW_1666864652.png) 92、[Umi-OCR](https://github.com/hiroi-sora/Umi-OCR) 基于 PaddleOCR 的 OCR 图片转文字识别软件。完全免费、可离线使用的开源软件,支持截屏识别文字、批量导入图片、横/竖排文字,还可以自动忽略水印区域,适用于 Win10 操作系统。 ![Umi-OCR](https://img.hellogithub.com/i/dqHW9Y5uKxXnOiZ_1666683051.png) 93、[whisper](https://github.com/openai/whisper) OpenAI 开源的多语言识别系统。该项目是强大的自动语音识别系统,支持包括中文在内的多种语言识别。尤其是在快语速、口音、背景噪音等场景,依旧表现出色,能够达到极高的准确率。 ``` import whisper model = whisper.load_model("base") result = model.transcribe("audio.mp3") print(result["text"]) # 命令行使用 # $ whisper --language Chinese --model large audio.wav ``` 94、[py4e](https://github.com/csev/py4e) 《Python for Everybody》适合所有人的 Python。不管你有没有编程基础,只要对编程感兴趣,都可以通过这本书学会 Python,进入有趣的编程世界。 ![py4e](https://img.hellogithub.com/i/vu6Xxw5n9MTRKe7_1669467972.png) 95、[Book3_Elements-of-Mathematics](https://github.com/Visualize-ML/Book3_Elements-of-Mathematics) 《数学要素》从加减乘除到机器学习。全彩多图的一本科普书,内容以图解+数学+编程为主。 ![Book3_Elements-of-Mathematics](https://img.hellogithub.com/i/V6CnGRKDumSjN8U_1669516269.png) 96、[AiLearning-Theory-Applying](https://github.com/ben1234560/AiLearning-Theory-Applying) 快速上手 AI 理论及应用实战。该教程包含学习 AI 必备的数学基础,机器学习实战小项目、深度学习入门、自然语言通用框架 BERT 实战,以及大量数据集。 97、[rocketry](https://github.com/Miksus/rocketry) 更加人性化的 Python 调度库。可通过 Python 装饰器语法,进行任务调度的 Python 库。它简单、优雅、高效,支持定时、并发(异步、多线程、多进程)、条件触发等功能。 ``` from rocketry import Rocketry from rocketry.conds import daily app = Rocketry() @app.task(daily) def do_daily(): ... @app.task(daily & file_exists("data.csv")) def do_things(): ... if __name__ == '__main__': app.run() ``` 98、[100-Days-Of-ML-Code](https://github.com/Avik-Jain/100-Days-Of-ML-Code) 《机器学习 100天》[中文版](https://github.com/MLEveryday/100-Days-Of-ML-Code) 99、[deeplearningbook-chinese](https://github.com/exacity/deeplearningbook-chinese) Deep Learning 中文版 100、[grequests](https://github.com/spyoungtech/grequests) Rquests + Gevent 让异步 HTTP 变得简单、人性化。 ``` >>> import grequests >>> def exception_handler(request, exception): ... print "Request failed" >>> reqs = [ ... grequests.get('http://httpbin.org/delay/1', timeout=0.001), ... grequests.get('http://fakedomain/'), ... grequests.get('http://httpbin.org/status/500')] >>> grequests.map(reqs, exception_handler=exception_handler) Request failed Request failed [None, None, ] ``` 101、[ScreenToGif](https://github.com/NickeManarin/ScreenToGif) 此工具可以记录屏幕的选定区域、网络摄像头的实时图像和绘图板上的实时图像。可以编辑并将动画保存为 GIF 或视频 ![ScreenToGif](https://img.hellogithub.com/i/qrsnHJF4pDN1zhU.png) 102、[MLAlgorithms](https://github.com/rushter/MLAlgorithms) 常见的机器学习算法,Python 实现: - [Deep learning (MLP, CNN, RNN, LSTM)](https://github.com/rushter/MLAlgorithms/tree/master/mla/neuralnet) - [Linear regression, logistic regression](https://github.com/rushter/MLAlgorithms/blob/master/mla/linear_models.py) - [Random Forests](https://github.com/rushter/MLAlgorithms/blob/master/mla/ensemble/random_forest.py) - [Support vector machine (SVM) with kernels (Linear, Poly, RBF)](https://github.com/rushter/MLAlgorithms/tree/master/mla/svm) - [K-Means](https://github.com/rushter/MLAlgorithms/blob/master/mla/kmeans.py) - 等等 103、[alfiopuglisi/guietta](https://github.com/alfiopuglisi/guietta) 用于制作简单 GUI 程序的 Python 库 ``` from guietta import _, Gui, Quit gui = Gui( [ "Enter numbers:", "__a__", "+", "__b__", ["Calculate"] ], [ "Result: -->", "result", _, _, _ ], [ _, _, _, _, Quit ] ) with gui.Calculate: gui.result = float(gui.a) + float(gui.b) gui.run() ``` ![图片](https://img.hellogithub.com/i/9rplOBJshj6czmG.png) 104、[testerSunshine/12306](https://github.com/testerSunshine/12306) 12306智能刷票,订票 105、[pjialin/py12306](https://github.com/pjialin/py12306) 12306 购票助手,支持集群,多账号,多任务购票以及 Web 页面管理