2 Star 9 Fork 6

tencentcloud/tencentcloud-sdk-nodejs

加入 Gitee
与超过 1400万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
ocr_client.ts 81.33 KB
一键复制 编辑 原始数据 按行查看 历史
tencentcloud 提交于 2026-04-10 04:36 +08:00 . release 4.1.210
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018118218318418518618718818919019119219319419519619719819920020120220320420520620720820921021121221321421521621721821922022122222322422522622722822923023123223323423523623723823924024124224324424524624724824925025125225325425525625725825926026126226326426526626726826927027127227327427527627727827928028128228328428528628728828929029129229329429529629729829930030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533633733833934034134234334434534634734834935035135235335435535635735835936036136236336436536636736836937037137237337437537637737837938038138238338438538638738838939039139239339439539639739839940040140240340440540640740840941041141241341441541641741841942042142242342442542642742842943043143243343443543643743843944044144244344444544644744844945045145245345445545645745845946046146246346446546646746846947047147247347447547647747847948048148248348448548648748848949049149249349449549649749849950050150250350450550650750850951051151251351451551651751851952052152252352452552652752852953053153253353453553653753853954054154254354454554654754854955055155255355455555655755855956056156256356456556656756856957057157257357457557657757857958058158258358458558658758858959059159259359459559659759859960060160260360460560660760860961061161261361461561661761861962062162262362462562662762862963063163263363463563663763863964064164264364464564664764864965065165265365465565665765865966066166266366466566666766866967067167267367467567667767867968068168268368468568668768868969069169269369469569669769869970070170270370470570670770870971071171271371471571671771871972072172272372472572672772872973073173273373473573673773873974074174274374474574674774874975075175275375475575675775875976076176276376476576676776876977077177277377477577677777877978078178278378478578678778878979079179279379479579679779879980080180280380480580680780880981081181281381481581681781881982082182282382482582682782882983083183283383483583683783883984084184284384484584684784884985085185285385485585685785885986086186286386486586686786886987087187287387487587687787887988088188288388488588688788888989089189289389489589689789889990090190290390490590690790890991091191291391491591691791891992092192292392492592692792892993093193293393493593693793893994094194294394494594694794894995095195295395495595695795895996096196296396496596696796896997097197297397497597697797897998098198298398498598698798898999099199299399499599699799899910001001100210031004100510061007100810091010101110121013101410151016101710181019102010211022102310241025102610271028102910301031103210331034103510361037103810391040104110421043104410451046104710481049105010511052105310541055105610571058105910601061106210631064106510661067106810691070107110721073107410751076107710781079108010811082108310841085108610871088108910901091109210931094109510961097109810991100110111021103110411051106110711081109111011111112111311141115111611171118111911201121112211231124112511261127112811291130113111321133113411351136113711381139114011411142114311441145114611471148114911501151115211531154115511561157115811591160116111621163116411651166116711681169117011711172117311741175117611771178117911801181118211831184118511861187118811891190119111921193119411951196119711981199120012011202120312041205120612071208120912101211121212131214121512161217121812191220122112221223122412251226122712281229123012311232123312341235123612371238123912401241124212431244124512461247124812491250125112521253125412551256125712581259126012611262126312641265126612671268126912701271127212731274127512761277127812791280128112821283128412851286128712881289129012911292129312941295129612971298129913001301130213031304130513061307130813091310131113121313131413151316131713181319132013211322132313241325132613271328132913301331133213331334133513361337133813391340134113421343134413451346134713481349135013511352135313541355135613571358135913601361136213631364136513661367136813691370137113721373137413751376137713781379138013811382138313841385138613871388138913901391139213931394139513961397139813991400140114021403140414051406140714081409141014111412141314141415141614171418141914201421142214231424142514261427142814291430143114321433143414351436143714381439144014411442144314441445144614471448144914501451145214531454145514561457145814591460146114621463146414651466146714681469147014711472147314741475147614771478147914801481148214831484148514861487148814891490149114921493149414951496149714981499150015011502150315041505150615071508150915101511151215131514151515161517151815191520152115221523152415251526152715281529153015311532153315341535153615371538153915401541154215431544154515461547154815491550155115521553155415551556155715581559156015611562156315641565156615671568156915701571157215731574157515761577157815791580158115821583158415851586158715881589159015911592159315941595159615971598159916001601160216031604160516061607160816091610161116121613161416151616161716181619162016211622162316241625162616271628162916301631163216331634163516361637163816391640164116421643164416451646164716481649165016511652165316541655165616571658165916601661166216631664166516661667166816691670167116721673167416751676167716781679168016811682168316841685168616871688168916901691169216931694169516961697169816991700170117021703170417051706170717081709171017111712171317141715171617171718171917201721172217231724172517261727172817291730173117321733173417351736173717381739174017411742174317441745174617471748174917501751175217531754175517561757175817591760176117621763176417651766176717681769177017711772177317741775177617771778177917801781178217831784178517861787178817891790179117921793179417951796179717981799180018011802180318041805180618071808180918101811181218131814181518161817181818191820182118221823182418251826182718281829183018311832183318341835183618371838183918401841184218431844184518461847184818491850185118521853185418551856185718581859186018611862186318641865186618671868186918701871187218731874187518761877187818791880188118821883188418851886188718881889189018911892189318941895189618971898189919001901190219031904190519061907190819091910191119121913191419151916191719181919192019211922192319241925192619271928192919301931193219331934193519361937193819391940194119421943194419451946194719481949195019511952195319541955195619571958195919601961196219631964196519661967196819691970197119721973197419751976197719781979198019811982198319841985198619871988
/* eslint-disable @typescript-eslint/no-unused-vars */
/*
* Copyright (c) 2018 Tencent. All Rights Reserved.
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* http://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing,
* software distributed under the License is distributed on an
* "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
* KIND, either express or implied. See the License for the
* specific language governing permissions and limitations
* under the License.
*/
import { AbstractClient } from "../../../common/abstract_client"
import { ClientConfig } from "../../../common/interface"
import {
TableOCRRequest,
StoreInfo,
NonTaxItem,
TextWaybill,
RecognizeOnlineTaxiItineraryOCRResponse,
InvoiceItem,
HKIDCardOCRRequest,
BankSlipOCRRequest,
BusinessCardOCRResponse,
QuotaInvoiceOCRRequest,
VinOCRResponse,
ResidencePermitInfo,
BankCardOCRRequest,
VatInvoiceItem,
CarInvoiceOCRRequest,
DescribeQuestionMarkAgentJobResponse,
ExtractDocMultiRequest,
QuestionSplitLayoutOCRRequest,
DescribeMarkEssayAgentJobResponse,
EstateCertOCRResponse,
ExtractDocMultiProRequest,
WordItem,
MLIDPassportOCRRequest,
OverseasInvoice,
ItemInfo,
VatRollInvoiceInfo,
TextDetectResponse,
TaxPayment,
TollInvoiceOCRResponse,
GetOCRTokenResponse,
IDCardInfoResult,
FinanBillSliceOCRResponse,
DriverLicenseOCRResponse,
WaybillOCRResponse,
Words,
TextDetectionEn,
ElectronicFlightTicketFull,
ClassifyStoreNameRequest,
InvoiceGeneralOCRRequest,
Rect,
CustomsPaymentReceipt,
QuestionSplitOCRRequest,
FlightInvoiceOCRRequest,
TextFormula,
HmtResidentPermitOCRResponse,
OtherInvoiceList,
VehicleRegCertInfo,
IDCardOCRResponse,
FlightItem,
Value,
EnterpriseLicenseOCRResponse,
BankSlip,
QuestionOCRResponse,
SealInfo,
SubmitQuestionMarkAgentJobRequest,
InvoiceGeneralInfo,
TextVatInvoice,
ShipInvoiceInfo,
VehicleInvoiceInfo,
DriverLicenseOCRRequest,
VerifyBizLicenseEnterprise4Response,
TollInvoiceOCRRequest,
OtherInvoiceItem,
TextDetection,
RecognizeTableOCRResponse,
TextEduPaper,
QrcodeOCRResponse,
CustomsDeclaration,
WaybillObj,
WordCoordPoint,
HKIDCardOCRResponse,
MainlandPermitOCRRequest,
VatElectronicItemInfo,
WordPolygon,
EnglishOCRRequest,
VehicleLicenseOCRRequest,
QuestionSplitOCRResponse,
TableOCRResponse,
RecognizeStoreNameRequest,
StructuralItem,
InvoiceDetectInfo,
FlightItemInfo,
FinanBillInfo,
TrainTicketOCRResponse,
TextFormulaInfo,
TollInvoiceInfo,
BankSlipInfo,
RecognizeFormulaOCRResponse,
ArithmeticOCRResponse,
FormulaOCRResponse,
RecognizeGeneralCardWarnRequest,
BusInvoiceInfo,
MixedInvoiceItem,
RecognizeEncryptedIDCardOCRRequest,
SmartStructuralOCRRequest,
ExtractDocMultiProResponse,
RecognizeTravelCardOCRRequest,
GeneralHandwritingOCRRequest,
BizLicenseOCRRequest,
MixedInvoiceDetectResponse,
RideHailingDriverLicenseOCRRequest,
SealOCRRequest,
VatInvoiceUserInfo,
CropEnhanceImageOCRResponse,
GeneralAccurateOCRResponse,
ElectronicTrainTicketFull,
BusInvoice,
QrcodeOCRRequest,
TaxiInvoiceOCRResponse,
RecognizeGeneralInvoiceRequest,
GeneralBasicOCRResponse,
MainlandTravelPermitBackInfos,
OtherInvoice,
CellContent,
RecognizeMedicalInvoiceOCRResponse,
RecognizeValidIDCardOCRRequest,
MixedInvoiceOCRResponse,
ClassifyDetectOCRResponse,
VinOCRRequest,
ExtractDocAgentResponse,
RecognizeStoreNameResponse,
OCRResult,
VehicleLicenseOCRResponse,
VatInvoiceOCRRequest,
ElectronicTollSummaryList,
ElectronicAirTransport,
ClassifyDetectOCRRequest,
DutyPaidProofOCRResponse,
MLIDCardOCRRequest,
LicensePlateOCRResponse,
ExtractDocBasicRequest,
ReflectDetailInfo,
MedicalInvoiceInfo,
VatInvoiceGoodsInfo,
RecognizeThaiIDCardOCRResponse,
GroupInfo,
QuotaInvoice,
ItemNames,
SingleInvoiceItem,
InvoiceGeneralOCRResponse,
OnlineTaxiItineraryInfo,
ExtractDocMultiResponse,
TaxiInvoiceOCRRequest,
MachinePrintedInvoice,
FinancialBillItem,
SingleInvoiceInfo,
RecognizeContainerOCRRequest,
TrainTicket,
TextDetectRequest,
VatRollInvoiceOCRResponse,
EduPaperOCRResponse,
RecognizeThaiIDCardOCRRequest,
IDCardConfig,
BusinessCardInfo,
MotorVehicleSaleInvoice,
TextArithmetic,
ElectronicTrainTicket,
RecognizeHealthCodeOCRResponse,
PassportRecognizeInfos,
SubmitExtractDocAgentJobResponse,
ImageEnhancementResponse,
PortraitImageInfo,
QrcodeImgSize,
PassportOCRResponse,
FinancialBillItemDetails,
CardWarnInfo,
VehicleRegCertOCRRequest,
QuestionSplitLayoutOCRResponse,
ElectronicAirTransportDetail,
FinancialBill,
SubmitMarkEssayAgentJobRequest,
LicensePlateOCRRequest,
GeneralBasicOCRRequest,
UsedVehicleInvoiceInfo,
TextVehicleBack,
SubmitMarkEssayAgentJobResponse,
GeneralEfficientOCRRequest,
AdvertiseOCRRequest,
AirTicketInfo,
SubmitQuestionMarkAgentJobResponse,
RideHailingDriverLicenseOCRResponse,
ImageEnhancementRequest,
ExtractDocBasicResponse,
EnterpriseLicenseOCRRequest,
VatInvoiceItemInfo,
VatElectronicInfo,
SmartStructuralOCRResponse,
DetectedWords,
IDCardInfo,
MedicalInvoiceItem,
GeneralAccurateOCRRequest,
RailwayTicketInfo,
RecognizeFormulaOCRRequest,
FlightInvoiceOCRResponse,
TemporaryIDCardInfo,
VatInvoiceVerifyNewRequest,
CarInvoiceInfo,
TableCellInfo,
FlightInvoiceInfo,
DetailInformationOfAirTicketTupleList,
TextVehicleFront,
AdvertiseTextDetection,
TextTable,
FinanBillSliceInfo,
ShoppingReceipt,
EraseHandwrittenImageOCRResponse,
Encryption,
ArithmeticOCRRequest,
NonTaxIncomeBill,
VerifyOfdVatInvoiceOCRRequest,
GetOCRTokenRequest,
FinanBillSliceOCRRequest,
RecognizeGeneralCardWarnResponse,
ClassifyStoreNameResponse,
DescribeExtractDocAgentJobRequest,
ElectronicTollSummaryItem,
ContentInfo,
MarkEssaySuggestions,
TableTitle,
RecognizeTableAccurateOCRRequest,
Coord,
SealOCRResponse,
InsuranceBillOCRResponse,
DutyPaidProofInfo,
FinanBillOCRResponse,
HandwritingEssayOCRRequest,
BankSlipOCRResponse,
OnlineTaxiItinerary,
Polygon,
PassInvoiceInfo,
QuestionObj,
TableInfo,
RequestIdInfo,
EduPaperOCRRequest,
FormulaOCRRequest,
TextGeneralHandwriting,
PassportOCRRequest,
DutyPaidProofOCRRequest,
ConfigAdvanced,
DescribeQuestionMarkAgentJobRequest,
LineInfo,
GeneralCardWarnInfo,
TollInvoice,
ItemCoord,
ItemPolygonInfo,
MixedInvoiceOCRRequest,
ShippingInvoice,
TableDetectInfo,
DescribeExtractDocAgentJobResponse,
ResidenceBookletOCRResponse,
VatInvoiceRoll,
CarInvoiceOCRResponse,
VehicleRegCertOCRResponse,
GeneralFastOCRRequest,
ImageSize,
ShipInvoiceOCRResponse,
RecognizeGeneralInvoiceResponse,
HandwritingEssayOCRResponse,
VerifyBizLicenseEnterprise4Request,
InsuranceBillInfo,
MarkInfo,
AnswerInfo,
QuestionOCRRequest,
TextTractorVehicleBack,
RecognizeMedicalInvoiceOCRRequest,
GeneralMachineItem,
ClassifyDetectInfo,
TrainTicketOCRRequest,
GeneralEfficientOCRResponse,
ShipInvoiceOCRRequest,
MLIDPassportOCRResponse,
CropEnhanceImageOCRRequest,
VerifyOfdVatInvoiceOCRResponse,
MedicalInvoice,
HmtResidentPermitOCRRequest,
RecognizeTableAccurateOCRResponse,
ResidenceBookletOCRRequest,
GetOCRResultRequest,
BusInvoiceOCRResponse,
VatInvoiceInfo,
EraseHandwrittenImageOCRRequest,
GetOCRResultResponse,
MainlandPermitOCRResponse,
VatInvoice,
PermitOCRRequest,
AirTransport,
QuestionInfo,
TaxiTicket,
UsedCarPurchaseInvoice,
EnglishOCRResponse,
ImageCoordinates,
BusInvoiceOCRRequest,
QuotaInvoiceOCRResponse,
RecognizeEncryptedIDCardOCRResponse,
Positions,
RideHailingTransportLicenseOCRResponse,
CandWord,
RecognizeContainerOCRResponse,
EnterpriseLicenseInfo,
PermitOCRResponse,
InsuranceBillOCRRequest,
GeneralHandwritingOCRResponse,
IDCardResult,
TableCell,
LicensePlateInfo,
DetectedWordCoordPoint,
QuestionBlockObj,
Element,
SubmitExtractDocAgentJobRequest,
ExtractDocAgentRequest,
AdvertiseOCRResponse,
ElectronicTollSummary,
RecognizeTravelCardOCRResponse,
VatRollInvoiceOCRRequest,
RecognizeOnlineTaxiItineraryOCRRequest,
IDCardOCRRequest,
MixedInvoiceDetectRequest,
VatRollItem,
QrcodeResultsInfo,
BusinessCertificateInfo,
WaybillOCRRequest,
RideHailingTransportLicenseOCRRequest,
VatInvoiceVerifyNewResponse,
MLIDCardOCRResponse,
RecognizeTableOCRRequest,
EstateCertOCRRequest,
SaleInventory,
PermanentResidencePermitInfo,
BizLicenseOCRResponse,
ResultList,
VatInvoiceOCRResponse,
InvoiceSealInfo,
BankCardOCRResponse,
RecognizeHealthCodeOCRRequest,
BusinessCardOCRRequest,
FinanBillOCRRequest,
RecognizeValidIDCardOCRResponse,
DescribeMarkEssayAgentJobRequest,
GeneralFastOCRResponse,
Key,
QrcodePositionObj,
} from "./ocr_models"
/**
* ocr client
* @class
*/
export class Client extends AbstractClient {
constructor(clientConfig: ClientConfig) {
super("ocr.tencentcloudapi.com", "2018-11-19", clientConfig)
}
/**
* 题目识别是教育的基础OCR识别能力。可支持扫描、拍照场景的单题题目识别。接口支持印刷体文本、手写体文本及公式的OCR识别和坐标返回,此外,接口还可对题目中的配图位置进行检测并返回坐标位置。适用于智能批改等场景的题目内容识别作为检索输入。
默认接口请求频率限制:2次/秒。
*/
async QuestionOCR(
req: QuestionOCRRequest,
cb?: (error: string, rep: QuestionOCRResponse) => void
): Promise<QuestionOCRResponse> {
return this.request("QuestionOCR", req, cb)
}
/**
* 本接口通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。
默认接口请求频率限制:5次/秒。
*/
async TextDetect(
req: TextDetectRequest,
cb?: (error: string, rep: TextDetectResponse) => void
): Promise<TextDetectResponse> {
return this.request("TextDetect", req, cb)
}
/**
* 本接口支持条形码和二维码的识别(包括 DataMatrix 和 PDF417)。
默认接口请求频率限制:5次/秒。
*/
async QrcodeOCR(
req: QrcodeOCRRequest,
cb?: (error: string, rep: QrcodeOCRResponse) => void
): Promise<QrcodeOCRResponse> {
return this.request("QrcodeOCR", req, cb)
}
/**
* 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
适用于文字较多、版式复杂、对识别准召率要求较高的场景,如试卷试题、网络图片、街景店招牌、法律卷宗等场景。
产品优势:与通用印刷体识别接口相比,本接口提供更高精度的通用文字识别服务,在手写体、文字较多、长串数字、小字、模糊字、倾斜文本等困难场景下,高精度版的准确率和召回率更高。
通用文字识别不同版本的差异如下:
<table style="width:715px">
<thead>
<tr>
<th style="width:150px"></th>
<th >【荐】通用文字识别(高精度版)</th>
<th style="width:300px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
</tr>
</thead>
<tbody>
<tr>
<td> 适用场景</td>
<td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
<td>适用于所有通用场景的印刷体识别</td>
</tr>
<tr>
<td>识别准确率</td>
<td>99%</td>
<td>96%</td>
</tr>
<tr>
<td>价格</td>
<td>中</td>
<td>低</td>
</tr>
<tr>
<td>支持的语言</td>
<td>中文、英文、泰语、印尼语、日语、韩语、西班牙语(智利)、西班牙语(墨西哥)、法语、德语、葡萄牙语、葡萄牙语(巴西)、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、哈萨克语、阿拉伯语、维吾尔语、藏语、捷克语、希腊语、希伯来语、克罗地亚语、波兰语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、土耳其语、保加利亚语、爱沙尼亚语、拉脱维亚语、立陶宛语、乌尔都文、塞尔维亚文、欧西坦文、毛利文、阿尔巴尼亚文、斯瓦希里文、乌兹别克文、乌克兰文、阿巴扎文、南非荷兰文、威尔士文、冰岛文、库尔德文、达尔瓦文、因古什文、拉克文、莱兹甘文、塔巴萨兰文、沙特阿拉伯文、阿瓦尔文、阿迪赫文、印度-古吉拉特语、印度-印地语、印度-孟加拉语、印度-卡纳达语、印度-马拉亚拉姆语、印度-马拉地语、印度-旁遮普语、印度-泰米尔语、印度-泰卢固语、阿塞拜疆语、波斯尼亚语、加泰罗尼亚语、卢森堡语、马耳他语、爱尔兰语、白俄罗斯语、高棉语、他加禄语、普什图语、波斯语、塔吉克斯坦语</td>
<td>中文、英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
</tr>
<tr>
<td>自动语言检测</td>
<td>中英文支持;其他语言需要调整输入参数</td>
<td>支持</td>
</tr>
<tr>
<td>返回文本行坐标</td>
<td>支持</td>
<td>支持</td>
</tr>
<tr>
<td>自动旋转纠正</td>
<td>支持旋转识别,返回角度信息</td>
<td>支持旋转识别,返回角度信息</td>
</tr>
</tbody>
</table>
默认接口请求频率限制:10次/秒。
*/
async GeneralAccurateOCR(
req: GeneralAccurateOCRRequest,
cb?: (error: string, rep: GeneralAccurateOCRResponse) => void
): Promise<GeneralAccurateOCRResponse> {
return this.request("GeneralAccurateOCR", req, cb)
}
/**
* 本接口支持集装箱箱门信息识别,识别字段包括集装箱箱号、类型、总重量、有效承重、容量、自身重量,具备集装箱箱号、类型不完整或者不清晰的告警功能。
默认接口请求频率限制:5次/秒。
*/
async RecognizeContainerOCR(
req: RecognizeContainerOCRRequest,
cb?: (error: string, rep: RecognizeContainerOCRResponse) => void
): Promise<RecognizeContainerOCRResponse> {
return this.request("RecognizeContainerOCR", req, cb)
}
/**
* 身份证识别(安全加密版)接口实现了数据加密传输,能够有效防止个人身份证隐私信息不被窃取泄露。
本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别速度快、准确度高。
另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备9种告警功能,如下表所示。
重要提醒:本产品告警功能依托AI检测技术,不可作为审核的唯一依据,应用前请做好效果测试。
<table style="width:650px">
<thead>
<tr>
<th width="150">扩展能力</th>
<th width="500">能力项</th>
</tr>
</thead>
<tbody>
<tr>
<td rowspan="2">裁剪功能</td>
<td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
</tr>
<tr>
<td>人像照片裁剪(自动抠取身份证头像区域)</td>
</tr>
<tr>
<td rowspan="9">告警功能</td>
<td>身份证有效日期不合法
</td>
</tr>
<tr>
<td>身份证边框不完整告警</td>
</tr>
<tr>
<td>身份证复印件告警</td>
</tr>
<tr>
<td>身份证翻拍告警</td>
</tr>
<tr>
<td>身份证框内遮挡告警</td>
</tr>
<tr>
<td>临时身份证告警</td>
</tr>
<tr>
<td>身份证疑似存在PS痕迹告警</td>
</tr>
<tr>
<td>图片模糊告警(可根据图片质量分数判断)</td>
</tr>
</tbody>
</table>
默认接口请求频率限制:20次/秒。
*/
async RecognizeEncryptedIDCardOCR(
req: RecognizeEncryptedIDCardOCRRequest,
cb?: (error: string, rep: RecognizeEncryptedIDCardOCRResponse) => void
): Promise<RecognizeEncryptedIDCardOCRResponse> {
return this.request("RecognizeEncryptedIDCardOCR", req, cb)
}
/**
* 本接口用于识别门头照文字识别结果以及对应分类标签信息
默认接口请求频率限制:1次/秒
*/
async RecognizeStoreName(
req: RecognizeStoreNameRequest,
cb?: (error: string, rep: RecognizeStoreNameResponse) => void
): Promise<RecognizeStoreNameResponse> {
return this.request("RecognizeStoreName", req, cb)
}
/**
* 本接口支持中国大陆地区及中国港澳台地区、其他国家以及地区的护照识别。识别字段包括护照ID、姓名、出生日期、性别、有效期、发行国、国籍、国家地区代码,具备护照人像照片的裁剪功能和翻拍、复印件告警功能。
本接口支持地区范围:可机读护照国家。包括中国大陆地区、中国港澳台地区、新加坡、马来西亚、泰国、美国、韩国、越南、澳大利亚、缅甸、印度尼西亚、日本、加拿大、老挝、巴基斯坦、哈萨克斯坦、法国、英国、德国、菲律宾、新西兰、印度、意大利、蒙古、孟加拉国、尼日利亚、柬埔寨、西班牙、摩洛哥、吉尔吉斯斯坦、埃及、荷兰、塔吉克斯坦、巴西、乌兹别克斯坦、伊拉克、阿尔及利亚、土耳其、南非、墨西哥、尼泊尔、白俄罗斯、叶门、阿富汗、沙特、肯尼亚、波兰、比利时、瑞典、奥地利、坦桑尼亚、委内瑞拉、阿根廷、喀麦隆、斯里兰卡、衣索比亚、约旦、瑞士、加纳、爱尔兰、哥伦比亚、苏丹、匈牙利、罗马尼亚、阿联酋、文莱、希腊、以色列、巴拿马、丹麦、伊朗、乌干达、挪威、秘鲁、葡萄牙、智利、塞尔维亚、芬兰、尚比亚、亚美尼亚、叙利亚、黎巴嫩、斯洛伐克、卡塔尔、古巴、朝鲜。
默认接口请求频率限制:5次/秒。
*/
async MLIDPassportOCR(
req: MLIDPassportOCRRequest,
cb?: (error: string, rep: MLIDPassportOCRResponse) => void
): Promise<MLIDPassportOCRResponse> {
return this.request("MLIDPassportOCR", req, cb)
}
/**
* 用于作文批改Agent提交任务。基于业界领先的千亿参数多模态大模型技术,提供中英文手写作文的精准批改端到端服务。核心功能涵盖错别字智能识别、好词好句点评、错句纠错,并能够在原文中定位至具体段落与字符位置,同时提供详细的修改建议与优化内容。此能力是作业批改场景中的核心模块。
默认接口请求并发限制:2次/分钟。
*/
async SubmitMarkEssayAgentJob(
req: SubmitMarkEssayAgentJobRequest,
cb?: (error: string, rep: SubmitMarkEssayAgentJobResponse) => void
): Promise<SubmitMarkEssayAgentJobResponse> {
return this.request("SubmitMarkEssayAgentJob", req, cb)
}
/**
* 本接口支持火车票全字段的识别,包括编号、出发站、到达站、出发时间、车次、座位号、姓名、票价、席别、身份证号、发票消费类型、序列号、加收票价、手续费、大写金额、售票站、原票价、发票类型、收据号码、是否仅供报销使用等字段的识别。
默认接口请求频率限制:5次/秒。
*/
async TrainTicketOCR(
req: TrainTicketOCRRequest,
cb?: (error: string, rep: TrainTicketOCRResponse) => void
): Promise<TrainTicketOCRResponse> {
return this.request("TrainTicketOCR", req, cb)
}
/**
* 本接口支持二代身份证、临时身份证、港澳台居住证、外国人永久居留证,字段内容识别功能,包括姓名、性别、民族、出生、出生日期、住址、公民身份号码、签发机关、有效期限、国籍、通行证号码、持证人持有号码;支持返回证件类型;支持翻拍、复印、边框不完整、遮挡、字段级反光和字段级完整性告警;支持卡片主体框裁剪和头像裁剪。
重要提醒:本产品告警功能依托AI检测技术,不可作为审核的唯一依据,应用前请做好效果测试。
默认接口请求频率限制:5次/秒。
*/
async RecognizeValidIDCardOCR(
req: RecognizeValidIDCardOCRRequest,
cb?: (error: string, rep: RecognizeValidIDCardOCRResponse) => void
): Promise<RecognizeValidIDCardOCRResponse> {
return this.request("RecognizeValidIDCardOCR", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持对通用机打发票的发票代码、发票号码、日期、合计金额(小写)、合计金额(大写)、购买方识别号、销售方识别号、校验码、购买方名称、销售方名称、时间、种类、发票消费类型、省、市、是否有公司印章、发票名称、购买方地址、电话、销售方地址、电话、购买方开户行及账号、销售方开户行及账号、经办人取票用户、经办人支付信息、经办人商户号、经办人订单号、货物或应税劳务、服务名称、数量、单价、税率、税额、金额、单位、规格型号、合计税额、合计金额、备注、收款人、复核、开票人、密码区、行业分类等字段的识别。
默认接口请求频率限制:5次/秒。
*/
async InvoiceGeneralOCR(
req: InvoiceGeneralOCRRequest,
cb?: (error: string, rep: InvoiceGeneralOCRResponse) => void
): Promise<InvoiceGeneralOCRResponse> {
return this.request("InvoiceGeneralOCR", req, cb)
}
/**
* 本接口支持中国香港身份证人像面中关键字段的识别,包括中文姓名、英文姓名、姓名电码、出生日期、性别、证件符号、首次签发日期、最近领用日期、身份证号、是否是永久性居民身份证;具备人像照片裁剪等扩展功能。
默认接口请求频率限制:5次/秒。
*/
async HKIDCardOCR(
req: HKIDCardOCRRequest,
cb?: (error: string, rep: HKIDCardOCRResponse) => void
): Promise<HKIDCardOCRResponse> {
return this.request("HKIDCardOCR", req, cb)
}
/**
* 本接口支持对卡式港澳台通行证的识别,包括签发地点、签发机关、有效期限、性别、出生日期、英文姓名、姓名、证件号等字段。
默认接口请求频率限制:10次/秒。
*/
async PermitOCR(
req: PermitOCRRequest,
cb?: (error: string, rep: PermitOCRResponse) => void
): Promise<PermitOCRResponse> {
return this.request("PermitOCR", req, cb)
}
/**
* 试卷切题(仅检测)可将整页练习册、试卷或教辅中的题目进行自动切题,返回试题边框的坐标位置。新客户请注意UseNewMode的选择。
默认接口请求频率限制:2次/秒。
*/
async QuestionSplitLayoutOCR(
req: QuestionSplitLayoutOCRRequest,
cb?: (error: string, rep: QuestionSplitLayoutOCRResponse) => void
): Promise<QuestionSplitLayoutOCRResponse> {
return this.request("QuestionSplitLayoutOCR", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持识别公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。
默认接口请求频率限制:5次/秒。
*/
async BusInvoiceOCR(
req: BusInvoiceOCRRequest,
cb?: (error: string, rep: BusInvoiceOCRResponse) => void
): Promise<BusInvoiceOCRResponse> {
return this.request("BusInvoiceOCR", req, cb)
}
/**
* 本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。
默认接口请求频率限制:10次/秒。
*/
async EnglishOCR(
req: EnglishOCRRequest,
cb?: (error: string, rep: EnglishOCRResponse) => void
): Promise<EnglishOCRResponse> {
return this.request("EnglishOCR", req, cb)
}
/**
* 本接口支持识别并提取各类证照、票据、表单、合同等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。
默认接口请求频率限制:5次/秒。
*/
async SmartStructuralOCR(
req: SmartStructuralOCRRequest,
cb?: (error: string, rep: SmartStructuralOCRResponse) => void
): Promise<SmartStructuralOCRResponse> {
return this.request("SmartStructuralOCR", req, cb)
}
/**
* 本接口用于识别门头照分类标签信息
默认接口请求频率限制:1次/秒
*/
async ClassifyStoreName(
req: ClassifyStoreNameRequest,
cb?: (error: string, rep: ClassifyStoreNameResponse) => void
): Promise<ClassifyStoreNameResponse> {
return this.request("ClassifyStoreName", req, cb)
}
/**
* 本接口支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期、上下车时间、里程、车牌号、发票类型及所属地区等字段。
默认接口请求频率限制:5次/秒。
*/
async TaxiInvoiceOCR(
req: TaxiInvoiceOCRRequest,
cb?: (error: string, rep: TaxiInvoiceOCRResponse) => void
): Promise<TaxiInvoiceOCRResponse> {
return this.request("TaxiInvoiceOCR", req, cb)
}
/**
* 模型参数更大,速度更慢。推荐场景:可以接受异步(超过30s返回),样本输入输出token大于2000,长文本类文档建议用异步模型。需要 SubmitExtractDocAgentJob(提交任务)、DescribeExtractDocAgentJob(查询任务)两个接口配套使用,计费发生在提交任务后。【备注:1.固定价格不限抽取字段数,2.自适应价格抽取字段大于10记两次费用,小于等于10记一次费用】
*/
async DescribeExtractDocAgentJob(
req: DescribeExtractDocAgentJobRequest,
cb?: (error: string, rep: DescribeExtractDocAgentJobResponse) => void
): Promise<DescribeExtractDocAgentJobResponse> {
return this.request("DescribeExtractDocAgentJob", req, cb)
}
/**
* 用于试题批改Agent提交任务。主要面向K12的试题批改产品,支持整卷/单题端到端(试卷切题+题目批改+手写坐标回显)处理,主要聚焦的场景包括试题批改(含手写答案)、试题解析(不含手写答案),其中低年级算式批改效果比线上[数学作业批改](https://cloud.tencent.com/document/product/1004)效果更好。精准输出题目、正误判定、答案对比、错误及知识点等结构化评估结果。
默认接口请求并发限制:10张/分钟。
*/
async SubmitQuestionMarkAgentJob(
req: SubmitQuestionMarkAgentJobRequest,
cb?: (error: string, rep: SubmitQuestionMarkAgentJobResponse) => void
): Promise<SubmitQuestionMarkAgentJobResponse> {
return this.request("SubmitQuestionMarkAgentJob", req, cb)
}
/**
* 本接口支持网约车驾驶证关键字段的识别,包括姓名、证号、起始日期、截止日期、发证日期。
默认接口请求频率限制:5次/秒。
*/
async RideHailingDriverLicenseOCR(
req: RideHailingDriverLicenseOCRRequest,
cb?: (error: string, rep: RideHailingDriverLicenseOCRResponse) => void
): Promise<RideHailingDriverLicenseOCRResponse> {
return this.request("RideHailingDriverLicenseOCR", req, cb)
}
/**
* 智能识别并结构化港澳台通行证及来往内地通行证正面全部字段,包含中文姓名、英文姓名、性别、出生日期、签发机关、有效期限、证件号、签发地点、签发次数、证件类别。
默认接口请求频率限制:20次/秒。
*/
async MainlandPermitOCR(
req: MainlandPermitOCRRequest,
cb?: (error: string, rep: MainlandPermitOCRResponse) => void
): Promise<MainlandPermitOCRResponse> {
return this.request("MainlandPermitOCR", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持机票行程单关键字段的识别,包括旅客姓名、有效身份证件号码、电子客票号码、验证码、填开单位、其他税费、燃油附加费、民航发展基金、保险费、销售单位代号、始发地、目的地、航班号、时间、日期、座位等级、承运人、发票消费类型、票价、合计金额、填开日期、国内国际标签、印刷序号、客票级别/类别、客票生效日期、有效期截止日期、免费行李等字段,支持航班信息多行明细输出。
默认接口请求频率限制:5次/秒。
*/
async FlightInvoiceOCR(
req: FlightInvoiceOCRRequest,
cb?: (error: string, rep: FlightInvoiceOCRResponse) => void
): Promise<FlightInvoiceOCRResponse> {
return this.request("FlightInvoiceOCR", req, cb)
}
/**
* 图像切边矫正增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度,可以作为所有识别场景的图像预处理原子能力,从而提升识别效果。
默认接口请求频率限制:5次/秒。
*/
async CropEnhanceImageOCR(
req: CropEnhanceImageOCRRequest,
cb?: (error: string, rep: CropEnhanceImageOCRResponse) => void
): Promise<CropEnhanceImageOCRResponse> {
return this.request("CropEnhanceImageOCR", req, cb)
}
/**
* 本接口支持 PDF多页(最多30页)、一页中单张、多张、类型票据的混合识别,同时支持单选识别某类票据,已支持票种包括:增值税发票(专票、普票、卷票、区块链发票、通行费发票)、全电发票(专票、普票)、非税发票(通用票据、统一缴纳书)、定额发票、通用机打发票、购车发票(机动车销售发票、二手车发票)、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票等常用标准报销发票,支持OFD格式的 增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(机票行程单)、电子发票(铁路电子客票)的第一页识别,并支持非上述类型的其他发票的智能识别,点击[立即试用](https://cloud.tencent.com/product/ocr)。
默认接口请求频率限制:5次/秒。
支持返回的细项目子票种SubType、子票种中文TypeDescription、以及对应所属大类票种Type 的说明如下列表:
<table style="width:715px">
<thead>
<tr>
<th style="width:200px">SubType 子票种英文</th>
<th style="width:200px">TypeDescription子票种中文</th>
<th >Type 所属大类票种</th>
</tr>
</thead>
<tbody>
<tr>
<td> VatSpecialInvoice</td>
<td> 增值税专用发票 </td>
<td> 3 </td>
</tr>
<tr>
<td> VatCommonInvoice</td>
<td> 增值税普通发票 </td>
<td> 3 </td>
</tr>
<tr>
<td> VatElectronicCommonInvoice </td>
<td> 增值税电子普通发票 </td>
<td> 3 </td>
</tr>
<tr>
<td> VatElectronicSpecialInvoice </td>
<td> 增值税电子专用发票 </td>
<td> 3 </td>
</tr>
<tr>
<td> VatElectronicInvoiceBlockchain</td>
<td> 区块链电子发票 </td>
<td> 3 </td>
</tr>
<tr>
<td> VatElectronicInvoiceToll</td>
<td> 增值税电子普通发票(通行费)</td>
<td> 3 </td>
</tr>
<tr>
<td> VatSalesList</td>
<td> 增值税销货清单</td>
<td> 3 </td>
</tr>
<tr>
<td> VatElectronicSpecialInvoiceFull</td>
<td> 电子发票(专用发票)</td>
<td> 16 </td>
</tr>
<tr>
<td> VatElectronicInvoiceFull</td>
<td> 电子发票(普通发票) </td>
<td> 16 </td>
</tr>
<tr>
<td> ElectronicFlightTicketFull</td>
<td> 电子发票(机票行程单)</td>
<td> 16 </td>
</tr>
<tr>
<td> ElectronicTrainTicketFull</td>
<td> 电子发票(铁路电子客票)</td>
<td> 16 </td>
</tr>
<tr>
<td> MotorVehicleSaleInvoice </td>
<td> 机动车销售统一发票 </td>
<td> 12 </td>
</tr>
<tr>
<td> UsedCarPurchaseInvoice </td>
<td> 二手车销售统一发票 </td>
<td> 12 </td>
</tr>
<tr>
<td> MotorVehicleSaleInvoiceElectronic </td>
<td> 机动车销售统一发票(电子)</td>
<td> 12 </td>
</tr>
<tr>
<td> UsedCarPurchaseInvoiceElectronic </td>
<td> 二手车销售统一发票(电子)</td>
<td> 12 </td>
</tr>
<tr>
<td> VatInvoiceRoll </td>
<td> 增值税普通发票(卷票) </td>
<td> 11 </td>
</tr>
<tr>
<td> TaxiTicket </td>
<td> 出租车发票 </td>
<td> 0 </td>
</tr>
<tr>
<td> QuotaInvoice </td>
<td> 定额发票 </td>
<td> 1 </td>
</tr>
<tr>
<td> TrainTicket </td>
<td> 火车票 </td>
<td> 2 </td>
</tr>
<tr>
<td> AirTransport </td>
<td> 机票行程单 </td>
<td> 5 </td>
</tr>
<tr>
<td> MachinePrintedInvoice </td>
<td> 通用机打发票 </td>
<td> 8 </td>
</tr>
<tr>
<td> BusInvoice </td>
<td> 汽车票 </td>
<td> 9 </td>
</tr>
<tr>
<td> ShippingInvoice </td>
<td> 轮船票 </td>
<td> 10 </td>
</tr>
<tr>
<td> NonTaxIncomeGeneralBill </td>
<td> 非税收入通用票据 </td>
<td> 15 </td>
</tr>
<tr>
<td> NonTaxIncomeElectronicBill </td>
<td> 非税收入一般缴款书(电子) </td>
<td> 15 </td>
</tr>
<tr>
<td> TollInvoice </td>
<td> 过路过桥费发票 </td>
<td> 13 </td>
</tr>
<tr>
<td> MedicalOutpatientInvoice </td>
<td> 医疗门诊收费票据(电子) </td>
<td> 17 </td>
</tr>
<tr>
<td> MedicalHospitalizedInvoice </td>
<td> 医疗住院收费票据(电子) </td>
<td> 17 </td>
</tr>
<tr>
<td> TaxPayment </td>
<td> 完税凭证 </td>
<td> 18 </td>
</tr>
<tr>
<td> CustomsPaymentReceipt </td>
<td> 海关缴款 </td>
<td> 19 </td>
</tr>
<tr>
<td> BankSlip </td>
<td> 银行回单 </td>
<td> 20 </td>
</tr>
<tr>
<td> OnlineTaxiItinerary </td>
<td> 网约车行程单 </td>
<td> 21 </td>
</tr>
<tr>
<td> CustomsDeclaration </td>
<td> 海关进/出口货物报关单 </td>
<td> 22 </td>
</tr>
<tr>
<td> OverseasInvoice </td>
<td> 海外发票 </td>
<td> 23 </td>
</tr>
<tr>
<td> ShoppingReceipt </td>
<td> 购物小票 </td>
<td> 24 </td>
</tr>
<tr>
<td> SaleInventory </td>
<td> 销货清单 </td>
<td> 25 </td>
</tr>
<tr>
<td> ElectronicTollSummary </td>
<td> 通行费电子票据汇总单 </td>
<td> 26 </td>
</tr>
<tr>
<td> OtherInvoice </td>
<td> 其他发票 </td>
<td> -1 </td>
</tr>
</tbody>
</table>
*/
async RecognizeGeneralInvoice(
req: RecognizeGeneralInvoiceRequest,
cb?: (error: string, rep: RecognizeGeneralInvoiceResponse) => void
): Promise<RecognizeGeneralInvoiceResponse> {
return this.request("RecognizeGeneralInvoice", req, cb)
}
/**
* 本接口支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。
默认接口请求频率限制:1次/秒。
*/
async InsuranceBillOCR(
req: InsuranceBillOCRRequest,
cb?: (error: string, rep: InsuranceBillOCRResponse) => void
): Promise<InsuranceBillOCRResponse> {
return this.request("InsuranceBillOCR", req, cb)
}
/**
* 本接口支持增值税发票的准确性核验,您可以通过输入增值税发票的关键字段提供所需的验证信息,接口返回真实的票面相关信息,包括发票代码、发票号码、开票日期、金额、消费类型、购方名称、购方税号、销方名称、销方税号等多个常用字段。支持多种发票类型核验,包括增值税专用发票、增值税普通发票(含电子普通发票、卷式发票、通行费发票)、全电发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票、通用机打电子发票(广东和浙江)。
默认接口请求频率限制:20次/秒。
*/
async VatInvoiceVerifyNew(
req: VatInvoiceVerifyNewRequest,
cb?: (error: string, rep: VatInvoiceVerifyNewResponse) => void
): Promise<VatInvoiceVerifyNewResponse> {
return this.request("VatInvoiceVerifyNew", req, cb)
}
/**
* 本接口支持图片内车辆识别代号(VIN)的检测和识别。
默认接口请求频率限制:10次/秒。
*/
async VinOCR(
req: VinOCRRequest,
cb?: (error: string, rep: VinOCRResponse) => void
): Promise<VinOCRResponse> {
return this.request("VinOCR", req, cb)
}
/**
* 本接口支持行驶证主页和副页所有字段的自动定位与识别。
行驶证主页:车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期、发证单位。
行驶证副页:号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录。
另外,本接口还支持复印件、翻拍告警功能。
默认接口请求频率限制:10次/秒。
*/
async VehicleLicenseOCR(
req: VehicleLicenseOCRRequest,
cb?: (error: string, rep: VehicleLicenseOCRResponse) => void
): Promise<VehicleLicenseOCRResponse> {
return this.request("VehicleLicenseOCR", req, cb)
}
/**
* 本接口支持快速精准识别营业执照上的字段,包括统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限和经营范围等字段。
默认接口请求频率限制:10次/秒。
*/
async BizLicenseOCR(
req: BizLicenseOCRRequest,
cb?: (error: string, rep: BizLicenseOCRResponse) => void
): Promise<BizLicenseOCRResponse> {
return this.request("BizLicenseOCR", req, cb)
}
/**
* 支持通用证照的有效性检测告警,包括卡证复印件告警、卡证翻拍告警等功能,支持通用证照的ps伪造检测,可以应用于各种证件信息有效性校验场景。
重要提醒:本产品依托AI检测技术,不可作为审核的唯一依据,应用前请做好效果测试。
默认接口请求频率限制:5次/秒。
*/
async RecognizeGeneralCardWarn(
req: RecognizeGeneralCardWarnRequest,
cb?: (error: string, rep: RecognizeGeneralCardWarnResponse) => void
): Promise<RecognizeGeneralCardWarnResponse> {
return this.request("RecognizeGeneralCardWarn", req, cb)
}
/**
* **建议您使用识别效果更好的[通用文字识别(高精度版](https://cloud.tencent.com/document/product/866/34937 ))**
本接口支持图像整体文字的检测和识别。可以识别中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言,且各种语言均支持与英文混合的文字识别。
适用于印刷文档识别、网络图片识别、广告图文字识别、街景店招牌识别、菜单识别、视频标题识别、头像文字识别等场景。
产品优势:支持自动识别语言类型,可返回文本框坐标信息,对于倾斜文本支持自动旋转纠正。
通用印刷体识别不同版本的差异如下:
<table style="width:715px">
<thead>
<tr>
<th style="width:150px"></th>
<th style="width:250px">【荐】通用印刷体识别</th>
<th ><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
</tr>
</thead>
<tbody>
<tr>
<td> 适用场景</td>
<td>适用于所有通用场景的印刷体识别</td>
<td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
</tr>
<tr>
<td>识别准确率</td>
<td>96%</td>
<td>99%</td>
</tr>
<tr>
<td>价格</td>
<td>低</td>
<td>中</td>
</tr>
<tr>
<td>支持的语言</td>
<td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
<td>中文、英文、中英文、泰语、印尼语、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、哈萨克语</td>
</tr>
<tr>
<td>自动语言检测</td>
<td>支持</td>
<td>中英文支持;其他语种需要调整输入参数</td>
</tr>
<tr>
<td>返回文本行坐标</td>
<td>支持</td>
<td>支持</td>
</tr>
<tr>
<td>自动旋转纠正</td>
<td>支持旋转识别,返回角度信息</td>
<td>支持旋转识别,返回角度信息</td>
</tr>
</tbody>
</table>
默认接口请求频率限制:20次/秒。
*/
async GeneralBasicOCR(
req: GeneralBasicOCRRequest,
cb?: (error: string, rep: GeneralBasicOCRResponse) => void
): Promise<GeneralBasicOCRResponse> {
return this.request("GeneralBasicOCR", req, cb)
}
/**
* 本接口支持泰国身份证识别,识别字段包括泰文姓名、英文姓名、地址、出生日期、身份证号码、首次领用日期、签发日期等字段。
本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
默认接口请求频率限制:10次/秒
*/
async RecognizeThaiIDCardOCR(
req: RecognizeThaiIDCardOCRRequest,
cb?: (error: string, rep: RecognizeThaiIDCardOCRResponse) => void
): Promise<RecognizeThaiIDCardOCRResponse> {
return this.request("RecognizeThaiIDCardOCR", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持定额发票的发票号码、发票代码、金额(大小写)、发票消费类型、地区及是否有公司印章等关键字段的识别。
默认接口请求频率限制:5次/秒。
*/
async QuotaInvoiceOCR(
req: QuotaInvoiceOCRRequest,
cb?: (error: string, rep: QuotaInvoiceOCRResponse) => void
): Promise<QuotaInvoiceOCRResponse> {
return this.request("QuotaInvoiceOCR", req, cb)
}
/**
* 本接口当前仅支持复杂磅单收发货单抽取,更多强推理场景支持定制咨询。点击[立即体验](https://ocrdemo.cloud.tencent.com/?action=ExtractDocMultiPro)。
默认接口请求频率限制:5次/秒。
*/
async ExtractDocMultiPro(
req: ExtractDocMultiProRequest,
cb?: (error: string, rep: ExtractDocMultiProResponse) => void
): Promise<ExtractDocMultiProResponse> {
return this.request("ExtractDocMultiPro", req, cb)
}
/**
* <b>此接口为表格识别的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/49525">新版表格识别</a>。</b>
本接口支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。
默认接口请求频率限制:10次/秒。
*/
async TableOCR(
req: TableOCRRequest,
cb?: (error: string, rep: TableOCRResponse) => void
): Promise<TableOCRResponse> {
return this.request("TableOCR", req, cb)
}
/**
* 本接口支持作业算式题目的自动识别和判分,目前覆盖 K12 学力范围内的 11 种题型,包括加减乘除四则、加减乘除已知结果求运算因子、判断大小、约等于估算、带余数除法、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式计算和解方程,平均识别精度达到93%以上。
默认接口请求频率限制:10次/秒。
*/
async ArithmeticOCR(
req: ArithmeticOCRRequest,
cb?: (error: string, rep: ArithmeticOCRResponse) => void
): Promise<ArithmeticOCRResponse> {
return this.request("ArithmeticOCR", req, cb)
}
/**
* 本接口支持不动产权证关键字段的识别,包括使用期限、面积、用途、权利性质、权利类型、坐落、共有情况、权利人、权利其他状况等。
默认接口请求频率限制:5次/秒。
*/
async EstateCertOCR(
req: EstateCertOCRRequest,
cb?: (error: string, rep: EstateCertOCRResponse) => void
): Promise<EstateCertOCRResponse> {
return this.request("EstateCertOCR", req, cb)
}
/**
* 本接口支持对中国大陆主流银行卡正反面关键字段的检测与识别,包括卡号、卡类型、卡名字、银行信息、有效期。支持竖排异形卡识别、多角度旋转图片识别。支持对复印件、翻拍件、边框遮挡的银行卡进行告警,可应用于各种银行卡信息有效性校验场景,如金融行业身份认证、第三方支付绑卡等场景。
默认接口请求频率限制:10次/秒。
*/
async BankCardOCR(
req: BankCardOCRRequest,
cb?: (error: string, rep: BankCardOCRResponse) => void
): Promise<BankCardOCRResponse> {
return this.request("BankCardOCR", req, cb)
}
/**
* 本功能可自动清除试卷图片中的手写与批改痕迹,并输出洁净的空白试卷。也可以配合集成图像切边矫正技术,能自动定位、拉平试卷区域,从而在最优预处理基础上实现更佳的擦除效果。
默认接口请求频率限制:5次/秒。
*/
async EraseHandwrittenImageOCR(
req: EraseHandwrittenImageOCRRequest,
cb?: (error: string, rep: EraseHandwrittenImageOCRResponse) => void
): Promise<EraseHandwrittenImageOCRResponse> {
return this.request("EraseHandwrittenImageOCR", req, cb)
}
/**
* 获取ocr的token值
*/
async GetOCRToken(
req: GetOCRTokenRequest,
cb?: (error: string, rep: GetOCRTokenResponse) => void
): Promise<GetOCRTokenResponse> {
return this.request("GetOCRToken", req, cb)
}
/**
* 本接口支持数学试题内容的识别和结构化输出,包括通用文本解析和小学/初中/高中数学公式解析能力(包括91种题型,180种符号),公式返回格式为 Latex 格式文本。
默认接口请求频率限制:5次/秒。
*/
async EduPaperOCR(
req: EduPaperOCRRequest,
cb?: (error: string, rep: EduPaperOCRResponse) => void
): Promise<EduPaperOCRResponse> {
return this.request("EduPaperOCR", req, cb)
}
/**
* 本接口支持智能化识别各类企业登记证书、许可证书、企业执照、三证合一类证书,结构化输出统一社会信用代码、公司名称、法定代表人、公司地址、注册资金、企业类型、经营范围、成立日期、有效期、开办资金、经费来源、举办单位等关键字段。
默认接口请求频率限制:5次/秒。
*/
async EnterpriseLicenseOCR(
req: EnterpriseLicenseOCRRequest,
cb?: (error: string, rep: EnterpriseLicenseOCRResponse) => void
): Promise<EnterpriseLicenseOCRResponse> {
return this.request("EnterpriseLicenseOCR", req, cb)
}
/**
* 本接口支持中英文名片各字段的自动定位与识别,包含姓名、电话、手机号、邮箱、公司、部门、职位、网址、地址、QQ、微信、MSN等。
默认接口请求频率限制:10次/秒。
*/
async BusinessCardOCR(
req: BusinessCardOCRRequest,
cb?: (error: string, rep: BusinessCardOCRResponse) => void
): Promise<BusinessCardOCRResponse> {
return this.request("BusinessCardOCR", req, cb)
}
/**
* 本接口支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限,识别准确度达到99%以上。
另外,本接口还支持多种扩展能力,满足不同场景的需求。如身份证照片、人像照片的裁剪功能,同时具备7种告警功能,如下表所示。
重要提醒:本产品告警功能依托AI检测技术,不可作为审核的唯一依据,应用前请做好效果测试。
<table style="width:650px">
<thead>
<tr>
<th width="150">扩展能力</th>
<th width="500">能力项</th>
</tr>
</thead>
<tbody>
<tr>
<td rowspan="2">裁剪功能</td>
<td>身份证照片裁剪(去掉证件外多余的边缘、自动矫正拍摄角度)</td>
</tr>
<tr>
<td>人像照片裁剪(自动抠取身份证头像区域)</td>
</tr>
<tr>
<td rowspan="9">告警功能</td>
</tr>
<tr>
<td>身份证有效日期不合法告警</td>
</tr>
<tr>
<td>身份证边框不完整告警</td>
</tr>
<tr>
<td>身份证复印件告警</td>
</tr>
<tr>
<td>身份证翻拍告警</td>
</tr>
<tr>
<td>身份证框内遮挡告警</td>
</tr>
<tr>
<td>临时身份证告警</td>
</tr>
<tr>
<td>身份证疑似存在PS痕迹告警</td>
</tr>
<tr>
<td>图片模糊告警(可根据图片质量分数判断)</td>
</tr>
</tbody>
</table>
默认接口请求频率限制:20次/秒。
*/
async IDCardOCR(
req: IDCardOCRRequest,
cb?: (error: string, rep: IDCardOCRResponse) => void
): Promise<IDCardOCRResponse> {
return this.request("IDCardOCR", req, cb)
}
/**
* 本接口支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别V2更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2。
默认接口请求频率限制:2次/秒。
*/
async RecognizeTableAccurateOCR(
req: RecognizeTableAccurateOCRRequest,
cb?: (error: string, rep: RecognizeTableAccurateOCRResponse) => void
): Promise<RecognizeTableAccurateOCRResponse> {
return this.request("RecognizeTableAccurateOCR", req, cb)
}
/**
* 本接口支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。
默认接口请求频率限制:5次/秒。
*/
async MixedInvoiceDetect(
req: MixedInvoiceDetectRequest,
cb?: (error: string, rep: MixedInvoiceDetectResponse) => void
): Promise<MixedInvoiceDetectResponse> {
return this.request("MixedInvoiceDetect", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持对增值税发票(卷票)关键字段的识别,包括的发票代码、合计金额(小写)、合计金额(大写)、开票日期、发票号码、购买方识别号、销售方识别号、校验码、销售方名称、购买方名称、发票消费类型、省、市、是否有公司印章、单价、金额、数量、服务类型、品名、种类等。
默认接口请求频率限制:5次/秒。
*/
async VatRollInvoiceOCR(
req: VatRollInvoiceOCRRequest,
cb?: (error: string, rep: VatRollInvoiceOCRResponse) => void
): Promise<VatRollInvoiceOCRResponse> {
return this.request("VatRollInvoiceOCR", req, cb)
}
/**
* 用于试题批改Agent查询任务。主要面向K12的试题批改产品,支持整卷/单题端到端(试卷切题+题目批改+手写坐标回显)处理,主要聚焦的场景包括试题批改(含手写答案)、试题解析(不含手写答案),其中低年级算式批改效果比线上[数学作业批改](https://cloud.tencent.com/document/product/1004)效果更好。精准输出题目、正误判定、答案对比、错误及知识点等结构化评估结果。
默认接口请求并发限制:10张/分钟。
*/
async DescribeQuestionMarkAgentJob(
req: DescribeQuestionMarkAgentJobRequest,
cb?: (error: string, rep: DescribeQuestionMarkAgentJobResponse) => void
): Promise<DescribeQuestionMarkAgentJobResponse> {
return this.request("DescribeQuestionMarkAgentJob", req, cb)
}
/**
* <b>此接口为通用手写体识别的旧版本服务,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/34937">通用印刷体识别(高精度)识别服务</a>。</b>
本接口支持图片内手写体文字的检测和识别,针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。
默认接口请求频率限制:10次/秒。
*/
async GeneralHandwritingOCR(
req: GeneralHandwritingOCRRequest,
cb?: (error: string, rep: GeneralHandwritingOCRResponse) => void
): Promise<GeneralHandwritingOCRResponse> {
return this.request("GeneralHandwritingOCR", req, cb)
}
/**
* 本接口支持识别并提取制式卡证、票据、表单等结构化场景的字段信息。无需任何配置,灵活高效。适用于各类结构化信息录入场景。点击[立即体验](https://ocrdemo.cloud.tencent.com/?action=ExtractDocBasic)。
接口别名:SmartStructuralOCRV2
默认接口请求频率限制:5次/秒。
*/
async ExtractDocBasic(
req: ExtractDocBasicRequest,
cb?: (error: string, rep: ExtractDocBasicResponse) => void
): Promise<ExtractDocBasicResponse> {
return this.request("ExtractDocBasic", req, cb)
}
/**
* 本接口支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。
默认接口请求频率限制:20次/秒。
*/
async RecognizeOnlineTaxiItineraryOCR(
req: RecognizeOnlineTaxiItineraryOCRRequest,
cb?: (error: string, rep: RecognizeOnlineTaxiItineraryOCRResponse) => void
): Promise<RecognizeOnlineTaxiItineraryOCRResponse> {
return this.request("RecognizeOnlineTaxiItineraryOCR", req, cb)
}
/**
* 本接口支持中英文图片/ PDF内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
默认接口请求频率限制:10次/秒。
*/
async RecognizeTableOCR(
req: RecognizeTableOCRRequest,
cb?: (error: string, rep: RecognizeTableOCRResponse) => void
): Promise<RecognizeTableOCRResponse> {
return this.request("RecognizeTableOCR", req, cb)
}
/**
* 模型参数更小,速度更快。推荐场景:实时性要求高(30s以内)并且样本输入输出token2000以内,建议用实时模型。【备注:1.固定价格不限抽取字段数,2.自适应价格抽取字段大于10记两次费用,小于等于10记一次费用】
默认接口请求频率限制:5次/秒。
*/
async ExtractDocAgent(
req: ExtractDocAgentRequest,
cb?: (error: string, rep: ExtractDocAgentResponse) => void
): Promise<ExtractDocAgentResponse> {
return this.request("ExtractDocAgent", req, cb)
}
/**
* 本接口支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。
默认接口请求频率限制:10次/秒。
*/
async WaybillOCR(
req: WaybillOCRRequest,
cb?: (error: string, rep: WaybillOCRResponse) => void
): Promise<WaybillOCRResponse> {
return this.request("WaybillOCR", req, cb)
}
/**
* 本接口专为教育场景设计,可高精度识别中英文手写字符,智能分栏并按阅读顺序分割内容,自动过滤手写与印刷体混排干扰,精准返回词、行、段落及标题的文本与坐标信息。点击[立即体验](https://ocrdemo.cloud.tencent.com/)。
默认接口请求频率限制:5次/秒。
*/
async HandwritingEssayOCR(
req: HandwritingEssayOCRRequest,
cb?: (error: string, rep: HandwritingEssayOCRResponse) => void
): Promise<HandwritingEssayOCRResponse> {
return this.request("HandwritingEssayOCR", req, cb)
}
/**
* 港澳台居住证OCR支持港澳台居住证正反面全字段内容检测识别功能,包括姓名、性别、出生日期、地址、身份证号、签发机关、有效期限、签发次数、通行证号码关键字段识别。可以应用于港澳台居住证信息识别场景,例如银行开户、用户注册等。
默认接口请求频率限制:20次/秒。
*/
async HmtResidentPermitOCR(
req: HmtResidentPermitOCRRequest,
cb?: (error: string, rep: HmtResidentPermitOCRResponse) => void
): Promise<HmtResidentPermitOCRResponse> {
return this.request("HmtResidentPermitOCR", req, cb)
}
/**
* 用于作文批改Agent查询任务。基于业界领先的千亿参数多模态大模型技术,提供中英文手写作文的精准批改端到端服务。核心功能涵盖错别字智能识别、好词好句点评、错句纠错,并能够在原文中定位至具体段落与字符位置,同时提供详细的修改建议与优化内容。此能力是作业批改场景中的核心模块。
默认接口请求并发限制:2次/分钟。
*/
async DescribeMarkEssayAgentJob(
req: DescribeMarkEssayAgentJobRequest,
cb?: (error: string, rep: DescribeMarkEssayAgentJobResponse) => void
): Promise<DescribeMarkEssayAgentJobResponse> {
return this.request("DescribeMarkEssayAgentJob", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。
默认接口请求频率限制:5次/秒。
*/
async TollInvoiceOCR(
req: TollInvoiceOCRRequest,
cb?: (error: string, rep: TollInvoiceOCRResponse) => void
): Promise<TollInvoiceOCRResponse> {
return this.request("TollInvoiceOCR", req, cb)
}
/**
* 支持身份证、护照、名片、银行卡、行驶证、驾驶证、港澳台通行证、户口本、港澳台来往内地通行证、港澳台居住证、不动产证、营业执照的智能分类。
默认接口请求频率限制:20次/秒。
*/
async ClassifyDetectOCR(
req: ClassifyDetectOCRRequest,
cb?: (error: string, rep: ClassifyDetectOCRResponse) => void
): Promise<ClassifyDetectOCRResponse> {
return this.request("ClassifyDetectOCR", req, cb)
}
/**
* 公式识别是教育的基础OCR识别能力,可支持理科(数学、物理、化学、生物)的印刷体和手写体的公式识别。
默认接口请求频率限制:2次/秒。
*/
async RecognizeFormulaOCR(
req: RecognizeFormulaOCRRequest,
cb?: (error: string, rep: RecognizeFormulaOCRResponse) => void
): Promise<RecognizeFormulaOCRResponse> {
return this.request("RecognizeFormulaOCR", req, cb)
}
/**
* 本接口支持各类印章主体内容、印章其他内容及形状识别,支持单图多印章识别,包括发票章、财务章等,适用于公文票据等场景。
默认接口请求频率限制:5次/秒。
*/
async SealOCR(
req: SealOCRRequest,
cb?: (error: string, rep: SealOCRResponse) => void
): Promise<SealOCRResponse> {
return this.request("SealOCR", req, cb)
}
/**
* 本接口支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。
默认接口请求频率限制:10次/秒。
*/
async BankSlipOCR(
req: BankSlipOCRRequest,
cb?: (error: string, rep: BankSlipOCRResponse) => void
): Promise<BankSlipOCRResponse> {
return this.request("BankSlipOCR", req, cb)
}
/**
* 本接口支持国内机动车登记证书主要字段的结构化识别,包括机动车所有人、身份证明名称、号码、车辆型号、车辆识别代号、发动机号、制造厂名称等。
默认接口请求频率限制:5次/秒。
*/
async VehicleRegCertOCR(
req: VehicleRegCertOCRRequest,
cb?: (error: string, rep: VehicleRegCertOCRResponse) => void
): Promise<VehicleRegCertOCRResponse> {
return this.request("VehicleRegCertOCR", req, cb)
}
/**
* 产品规划
本接口支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。
默认接口请求频率限制:20次/秒。
*/
async RecognizeTravelCardOCR(
req: RecognizeTravelCardOCRRequest,
cb?: (error: string, rep: RecognizeTravelCardOCRResponse) => void
): Promise<RecognizeTravelCardOCRResponse> {
return this.request("RecognizeTravelCardOCR", req, cb)
}
/**
* 模型参数更大,速度更慢。推荐场景:可以接受异步(超过30s返回),样本输入输出token大于2000,长文本类文档建议用异步模型。需要 SubmitExtractDocAgentJob(提交任务)、DescribeExtractDocAgentJob(查询任务)两个接口配套使用,计费发生在提交任务后。【备注:1.固定价格不限抽取字段数,2.自适应价格抽取字段大于10记两次费用,小于等于10记一次费用】
*/
async SubmitExtractDocAgentJob(
req: SubmitExtractDocAgentJobRequest,
cb?: (error: string, rep: SubmitExtractDocAgentJobResponse) => void
): Promise<SubmitExtractDocAgentJobResponse> {
return this.request("SubmitExtractDocAgentJob", req, cb)
}
/**
* 本接口支持OFD格式的增值税电子普通发票、增值税电子专用发票、电子发票(普通发票)、电子发票(增值税专用发票)、电子发票(铁路电子客票)、电子发票(航空运输电子客票行程单)识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。
*/
async VerifyOfdVatInvoiceOCR(
req: VerifyOfdVatInvoiceOCRRequest,
cb?: (error: string, rep: VerifyOfdVatInvoiceOCRResponse) => void
): Promise<VerifyOfdVatInvoiceOCRResponse> {
return this.request("VerifyOfdVatInvoiceOCR", req, cb)
}
/**
* 本接口支持驾驶证主页和副页所有字段的自动定位与识别,重点字段的识别准确度达到99%以上。
驾驶证主页:包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位
驾驶证副页:包括证号、姓名、档案编号、记录。
另外,本接口还支持复印件、翻拍告警功能。同时支持识别交管12123 APP发放的电子驾驶证正页。
电子驾驶证正页:包括证号、姓名、性别、国籍、出生日期、初次领证日期、准驾车型、有效期开始时间、有效期截止时间、档案编号、状态、累积记分。
默认接口请求频率限制:10次/秒。
*/
async DriverLicenseOCR(
req: DriverLicenseOCRRequest,
cb?: (error: string, rep: DriverLicenseOCRResponse) => void
): Promise<DriverLicenseOCRResponse> {
return this.request("DriverLicenseOCR", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。
默认接口请求频率限制:5次/秒。
*/
async FinanBillOCR(
req: FinanBillOCRRequest,
cb?: (error: string, rep: FinanBillOCRResponse) => void
): Promise<FinanBillOCRResponse> {
return this.request("FinanBillOCR", req, cb)
}
/**
* 本接口支持 单张、多张、多类型 票据的混合识别,同时支持自选需要识别的票据类型,已支持票种包括:增值税发票(专票、普票、卷票)、全电发票、非税发票、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票共14种标准报销发票,并支持其他类发票的识别。
默认接口请求频率限制:5次/秒。
*/
async MixedInvoiceOCR(
req: MixedInvoiceOCRRequest,
cb?: (error: string, rep: MixedInvoiceOCRResponse) => void
): Promise<MixedInvoiceOCRResponse> {
return this.request("MixedInvoiceOCR", req, cb)
}
/**
* 产品规划
本接口支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。不同省市健康码显示的字段信息有所不同,上述字段的识别结果可能为空,以图片上具体展示的信息为准。
默认接口请求频率限制:10次/秒。
*/
async RecognizeHealthCodeOCR(
req: RecognizeHealthCodeOCRRequest,
cb?: (error: string, rep: RecognizeHealthCodeOCRResponse) => void
): Promise<RecognizeHealthCodeOCRResponse> {
return this.request("RecognizeHealthCodeOCR", req, cb)
}
/**
* 文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。
默认接口请求频率限制:10次/秒。
*/
async ImageEnhancement(
req: ImageEnhancementRequest,
cb?: (error: string, rep: ImageEnhancementResponse) => void
): Promise<ImageEnhancementResponse> {
return this.request("ImageEnhancement", req, cb)
}
/**
* 试卷切题识别可将整页练习册、试卷或教辅中的题目进行自动切题,并识别出其中的文字内容和坐标位置。新接入客户请注意UseNewModel选择
默认接口请求频率限制:2次/秒。
*/
async QuestionSplitOCR(
req: QuestionSplitOCRRequest,
cb?: (error: string, rep: QuestionSplitOCRResponse) => void
): Promise<QuestionSplitOCRResponse> {
return this.request("QuestionSplitOCR", req, cb)
}
/**
* 提供比对校验企业名称、统一社会信用代码、法人姓名、注册登记证件号码一致性的服务,助力快速核验企业资质。
注意:
存在个别特殊情况下核验结果不准确,请选用前知悉;
按周更新企业信息变更情况,如遇到未及时更新的情况,可联系在线客服转产品团队进行人工处理。
*/
async VerifyBizLicenseEnterprise4(
req: VerifyBizLicenseEnterprise4Request,
cb?: (error: string, rep: VerifyBizLicenseEnterprise4Response) => void
): Promise<VerifyBizLicenseEnterprise4Response> {
return this.request("VerifyBizLicenseEnterprise4", req, cb)
}
/**
* 本接口支持马来西亚身份证识别,识别字段包括身份证号、姓名、性别、地址;具备身份证人像照片的裁剪功能和翻拍、复印件告警功能。
本接口暂未完全对外开放,如需咨询,请[联系商务](https://cloud.tencent.com/about/connect)
*/
async MLIDCardOCR(
req: MLIDCardOCRRequest,
cb?: (error: string, rep: MLIDCardOCRResponse) => void
): Promise<MLIDCardOCRResponse> {
return this.request("MLIDCardOCR", req, cb)
}
/**
* 医疗发票识别目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票的识别。
默认接口请求频率限制:5次/秒。
*/
async RecognizeMedicalInvoiceOCR(
req: RecognizeMedicalInvoiceOCRRequest,
cb?: (error: string, rep: RecognizeMedicalInvoiceOCRResponse) => void
): Promise<RecognizeMedicalInvoiceOCRResponse> {
return this.request("RecognizeMedicalInvoiceOCR", req, cb)
}
/**
* 本接口支持图片中整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,识别速度更快。
默认接口请求频率限制:10次/秒。
*/
async GeneralFastOCR(
req: GeneralFastOCRRequest,
cb?: (error: string, rep: GeneralFastOCRResponse) => void
): Promise<GeneralFastOCRResponse> {
return this.request("GeneralFastOCR", req, cb)
}
/**
* 本接口支持增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通发票)、电子发票(增值税专用发票)全字段的内容检测和识别,包括发票代码、发票号码、打印发票代码、打印发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方识别号、复核、销售方识别号、开票人、密码区1、密码区2、密码区3、密码区4、发票名称、购买方名称、销售方名称、服务名称、备注、规格型号、数量、单价、金额、税额、收款人等字段,点击[立即试用](https://cloud.tencent.com/product/ocr)。
默认接口请求频率限制:10次/秒。
*/
async VatInvoiceOCR(
req: VatInvoiceOCRRequest,
cb?: (error: string, rep: VatInvoiceOCRResponse) => void
): Promise<VatInvoiceOCRResponse> {
return this.request("VatInvoiceOCR", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持对完税证明的税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等关键字段的识别。
默认接口请求频率限制:5次/秒。
*/
async DutyPaidProofOCR(
req: DutyPaidProofOCRRequest,
cb?: (error: string, rep: DutyPaidProofOCRResponse) => void
): Promise<DutyPaidProofOCRResponse> {
return this.request("DutyPaidProofOCR", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括金额、账号、日期、凭证号码等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像。)
默认接口请求频率限制:5次/秒。
*/
async FinanBillSliceOCR(
req: FinanBillSliceOCRRequest,
cb?: (error: string, rep: FinanBillSliceOCRResponse) => void
): Promise<FinanBillSliceOCRResponse> {
return this.request("FinanBillSliceOCR", req, cb)
}
/**
* 本接口支持对中国大陆机动车车牌的自动定位和识别,返回地域编号和车牌号码与车牌颜色信息。
默认接口请求频率限制:10次/秒。
*/
async LicensePlateOCR(
req: LicensePlateOCRRequest,
cb?: (error: string, rep: LicensePlateOCRResponse) => void
): Promise<LicensePlateOCRResponse> {
return this.request("LicensePlateOCR", req, cb)
}
/**
* 本接口支持识别并提取场景复杂、版式多等结构化场景的字段信息。重点场景包括:金融、医疗、交通、出行、保险。点击[立即体验](https://ocrdemo.cloud.tencent.com/?action=ExtractDocMulti)。
接口别名:SmartStructuralPro
默认接口请求频率限制:5次/秒。
*/
async ExtractDocMulti(
req: ExtractDocMultiRequest,
cb?: (error: string, rep: ExtractDocMultiResponse) => void
): Promise<ExtractDocMultiResponse> {
return this.request("ExtractDocMulti", req, cb)
}
/**
* 本接口支持图像整体文字的检测和识别。支持中文、英文、中英文、数字和特殊字符号的识别,并返回文字框位置和文字内容。
适用于快速文本识别场景。
产品优势:与通用印刷体识别接口相比,精简版虽然在准确率和召回率上有一定损失,但价格更加优惠。
通用印刷体识别不同版本的差异如下:
<table style="width:715px">
<thead>
<tr>
<th style="width:150px"></th>
<th >通用印刷体识别(精简版)</th>
<th style="width:200px"><a href="https://cloud.tencent.com/document/product/866/33526">【荐】通用印刷体识别</a></th>
<th><a href="https://cloud.tencent.com/document/product/866/34937">【荐】通用印刷体识别(高精度版)</a></th>
</tr>
</thead>
<tbody>
<tr>
<td> 适用场景</td>
<td>适用于快速文本识别场景,准召率有一定损失,价格更优惠</td>
<td>适用于所有通用场景的印刷体识别</td>
<td>适用于文字较多、长串数字、小字、模糊字、倾斜文本等困难场景</td>
</tr>
<tr>
<td>识别准确率</td>
<td>91%</td>
<td>96%</td>
<td>99%</td>
</tr>
<tr>
<td>价格</td>
<td>低</td>
<td>中</td>
<td>高</td>
</tr>
<tr>
<td>支持的语言</td>
<td>中文、英文、中英文</td>
<td>中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语</td>
<td>中文、英文、中英文</td>
</tr>
<tr>
<td>自动语言检测</td>
<td>支持</td>
<td>支持</td>
<td>支持</td>
</tr>
<tr>
<td>返回文本行坐标</td>
<td>支持</td>
<td>支持</td>
<td>支持</td>
</tr>
<tr>
<td>自动旋转纠正</td>
<td>支持旋转识别,返回角度信息</td>
<td>支持旋转识别,返回角度信息</td>
<td>支持旋转识别,返回角度信息</td>
</tr>
</tbody>
</table>
默认接口请求频率限制:10次/秒。
*/
async GeneralEfficientOCR(
req: GeneralEfficientOCRRequest,
cb?: (error: string, rep: GeneralEfficientOCRResponse) => void
): Promise<GeneralEfficientOCRResponse> {
return this.request("GeneralEfficientOCR", req, cb)
}
/**
* 支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。支持中英文、横排、竖排以及倾斜场景文字识别,支持90度、180度、270度翻转以及倾斜场景文字识别,具有较高召回率和准确率。
默认接口请求频率限制:20次/秒。
*/
async AdvertiseOCR(
req: AdvertiseOCRRequest,
cb?: (error: string, rep: AdvertiseOCRResponse) => void
): Promise<AdvertiseOCRResponse> {
return this.request("AdvertiseOCR", req, cb)
}
/**
* 本接口支持居民户口簿户主页及成员页关键字段的识别,包括姓名、户别、地址、籍贯、身份证号码等。
默认接口请求频率限制:5次/秒。
*/
async ResidenceBookletOCR(
req: ResidenceBookletOCRRequest,
cb?: (error: string, rep: ResidenceBookletOCRResponse) => void
): Promise<ResidenceBookletOCRResponse> {
return this.request("ResidenceBookletOCR", req, cb)
}
/**
* 本接口支持机动车销售统一发票和二手车销售统一发票的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。
默认接口请求频率限制:5次/秒。
*/
async CarInvoiceOCR(
req: CarInvoiceOCRRequest,
cb?: (error: string, rep: CarInvoiceOCRResponse) => void
): Promise<CarInvoiceOCRResponse> {
return this.request("CarInvoiceOCR", req, cb)
}
/**
* 获取ocr结果
*/
async GetOCRResult(
req: GetOCRResultRequest,
cb?: (error: string, rep: GetOCRResultResponse) => void
): Promise<GetOCRResultResponse> {
return this.request("GetOCRResult", req, cb)
}
/**
* 本接口支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。
默认接口请求频率限制:5次/秒。
*/
async FormulaOCR(
req: FormulaOCRRequest,
cb?: (error: string, rep: FormulaOCRResponse) => void
): Promise<FormulaOCRResponse> {
return this.request("FormulaOCR", req, cb)
}
/**
* <b>此接口为护照识别(中国大陆地区护照)的旧版本服务,不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/37657">护照识别(多国多地区护照)</a>。</b>
本接口支持中国大陆地区护照个人资料页多个字段的检测与识别。已支持字段包括英文姓名、中文姓名、国家码、护照号、出生地、出生日期、国籍英文、性别英文、有效期、签发地点英文、签发日期、持证人签名、护照机读码(MRZ码)等。
默认接口请求频率限制:10次/秒。
*/
async PassportOCR(
req: PassportOCRRequest,
cb?: (error: string, rep: PassportOCRResponse) => void
): Promise<PassportOCRResponse> {
return this.request("PassportOCR", req, cb)
}
/**
* <b>此接口不再进行服务升级,建议您使用识别能力更强、服务性能更优的<a href="https://cloud.tencent.com/document/product/866/90802">通用票据识别(高级版)</a>。</b>
本接口支持识别轮船票的发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种字段。
默认接口请求频率限制:5次/秒。
*/
async ShipInvoiceOCR(
req: ShipInvoiceOCRRequest,
cb?: (error: string, rep: ShipInvoiceOCRResponse) => void
): Promise<ShipInvoiceOCRResponse> {
return this.request("ShipInvoiceOCR", req, cb)
}
/**
* 本接口支持网约车运输证关键字段的识别,包括交运管许可字号、车辆所有人、车辆号牌、起始日期、截止日期、发证日期。
默认接口请求频率限制:5次/秒。
*/
async RideHailingTransportLicenseOCR(
req: RideHailingTransportLicenseOCRRequest,
cb?: (error: string, rep: RideHailingTransportLicenseOCRResponse) => void
): Promise<RideHailingTransportLicenseOCRResponse> {
return this.request("RideHailingTransportLicenseOCR", req, cb)
}
}
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/tencentcloud/tencentcloud-sdk-nodejs.git
git@gitee.com:tencentcloud/tencentcloud-sdk-nodejs.git
tencentcloud
tencentcloud-sdk-nodejs
tencentcloud-sdk-nodejs
master

搜索帮助