# ai
**Repository Path**: hry8310/ai
## Basic Information
- **Project Name**: ai
- **Description**: AI的
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2023-02-21
- **Last Updated**: 2025-11-20
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
AI概述
AI是自己学习开发的一些智能算法。其中dl主要是深度学习的内容(神经网络部分)。ml主要是机器学习的内容(包含部分opencv\dlib的视觉内容)
ml
ml 目录主要包含一些机器学习的分类、聚类算法,当中混合了一些视觉相关的分类聚类算法(主要是依赖于opencv 和dlib 等库实现的小功能)
- 分类
- adaboost:python的原生实现
- bys:朴素贝叶斯的实现
- kmeans:实现最原始的kmeans,使用欧氏几何,支持高斯核(RBF)核函数映射到高维几何
- knn:python的原生实现,使用欧氏几何
- svm:python的原生实现,使用欧氏几何,支持多种核函数映射到高维几何,使用 cvxopt 解方程组。获得二次规划的解
- tree:实现ID3\C4.5\CART的版本。没有实现剪枝
- 视觉
- ex-face:opencv+dlib 实现的换脸。采用凸包和对应的特征点,划分多个三角形分别复制
- hear:使用opencv的Hear 工具,主要用于在liunx下生成各种sh脚本,包括样本create脚本、train 脚本等
- hog:使用opencv 的svm对图片的正负样本进行分类。对样本要求极高,特别是正样本,对于长高,角度,旋转都有严格的要求。相对于CNN的特征提取能力,相对较弱
- liveness:活体检测。包括摇头、张嘴、眨眼等
- sock_liveness:活体的sock版。通过网络传输视频帧实现
- same_face:检测同一张脸。在给定的多张人脸照片中,将是同一个人的照片归为一组,这样可以通过算法,将这些人的不同人脸照片。按人分组。
先是使用dlib提取人脸关键点特征。再根据聚类使用两种方式进行聚类:1、sklearn的DBSCAN,在聚类过程效果不太好,2、dlib的chinese_whispers。聚类效果明显优于 dbscan
dl
dl 目录主要包含一些深度学习的算法,主要是一些神经网络的实现,大多是cnn相关的神经网络
tcnn:居于tf(tensorflow,以后基本都用tf做简称)实现的cnn 文本分类器,主要使用区分文本相关内容,如:体育新闻、教育资讯等,使用简单的一层conv\pool+全连接+droopout。最后将输出层采用softmax做预测
dvc:居于tf实现的cnn 图片分类器,主要使用区分 cat 和 dog ,使用简单的三层conv\pool+全连接+droopout+全连接。最后将输出层做预测
rnn:居于tf 实现的简单rnn。里面有简单的lstm
tf-yolo3 居于tf实现的yolo3,边框的损失都是使用平方损失函数,当中还包含了一些与移植相关的代码,如pb文件的生成和使用等
pytorch-yolo3 居于pytorch 框架实现的yolo3,边框的损失都是使用IOU最大化的损失函数
wanwan
wanwan 目录主要是一个rag的外挂体
采用chromadb作为向量数据库
外接postreg vectordb 作为传统信息与向量信息的结合、实现关系型数据与向量数据结合。有助于传统信息的过度
外接mysql可以对接管理信息
主要居于langchain开发
使用fastapi与传统的web应用对接
持续更新中.....