# address-aligning **Repository Path**: zygzzp/address-aligning ## Basic Information - **Project Name**: address-aligning - **Description**: 基于预训练bert的地址对齐,项目来自于尚硅谷ai课程 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-11-21 - **Last Updated**: 2025-11-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # address-aligning ## 介绍 ​ 基于预训练bert的地址对齐,项目来自于尚硅谷ai课程 ​ 本项目旨在训练地址标注模型,并搭建地址对齐服务。使用模型标注地址文本信息中的省市区县等信息。抽取标注数据组成结构化数据。参照地址数据表对地址数据进行校验,剔除或修正不符合要求的信息,合理补全缺失的数据。 ## 项目需求 1. 命名实体识别-从地址中提取结构化数据 2. 合理补全缺失的信息包含 - 缺号省、市、或区 3. 地址错乱,主要包含以下情况 1. 市错误 2. 区错误 ## 实现方案 ​ 本质是命名实体识别,采用预训练模型bert,自定义模型在bert后增加一个线性层 用于预测每一个token的类型