阿里云文字识别(OCR)服务 Quick Start

简介: 阿里云文字识别(Optical Character Recognition,OCR)可以将图片中的文字信息转换为可编辑文本,是一款由阿里巴巴达摩院权威AI团队打造的全栈全场景OCR文本识别类产品。根据客户的业务场景和需求,将产品分为了通用文字识别、个人证照识别、票据凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种文字识别等,满足各种客户的图片识别需求。由于阿里云视觉智能开放平台和云市场这两个渠道下也具备阿里文字识别服务,一些不熟悉的客户很容易将三者搞混淆,这边简单做下对比。然后再针对个人证照识别下常见的服务-身份证识别功能简单介绍下产品的开通及使用。

一、产品对比

  • 1.1 阿里云文字识别(OCR)与云市场文字识别
    官网阿里云文字识别资源包和云市场一方,都是阿里云官方的渠道,只是产品的服务放在云市场售卖。两者产品能力完全一样,但是两边资源包不通用,调用接口方式不同;另外后续产品上架的新服务,优先上架官网处。

云市场用appcode调用,仅支持资源包,阿里云官网用AccessKey调用,支持资源包和后付费。请参考链接:
官网控制台:https://ocr.console.aliyun.com/overview
官网获取AccessKey:https://help.aliyun.com/document_detail/295361.html
云市场AppCode:https://market.console.aliyun.com/imageconsole/index.htm

  • 1.2 视觉智能开放平台与阿里云文字识别(OCR)

视觉智能平台OCR,则是完全另一个产品,不属于读光OCR,但是其底层技术能力都是达摩院研发,只是不同的开发团队;视觉智能平台除了OCR之外,还有一些别的能力,比如分割抠图、视频理解、视觉生产等。所以相比官网阿里云文字识别(OCR)功能更广一些,而官网文字识别(OCR)做的更加基础一些,对于文字识别的能力更加集中一些。

二、开通服务

  • 2.1 阿里云页面搜索文字识别服务

image.png


image.png


  • 2.2 确认服务后开通

image.png


image.png


image.png


三、调用服务

  • 3.1 读光体验馆体验测试

    • 测试方法:选择所需的产品并在体验馆中上传测试图片或者添加URL地址进行图片解析,右侧为返回的结果。
  • 选择需要的服务

image.png

  • 传测试图片或者添加URL地址进行图片解析

image.png

  • 查看识别结果

image.png

  • 3.2 openAPI快速调试

    • 查看API接口文档获取请求参数

image.png

  • 填入参数发起调用

image.png

  • 3.3 JavaSDK调用身份证识别

    • 导入Maven依赖文件
<dependency>
  <groupId>com.aliyun</groupId>
  <artifactId>ocr_api20210707</artifactId>
  <version>1.1.3</version>
</dependency>
  • java SDK Code
import com.aliyun.ocr_api20210707.models.RecognizeIdcardResponse;
import com.aliyun.tea.TeaException;
import com.google.gson.Gson;

//印刷文字识别-身份证识别
public class RecognizeIdcardTest {

        /**
         * 使用AK&SK初始化账号Client
         *
         * @param accessKeyId
         * @param accessKeySecret
         * @return Client
         * @throws Exception
         */
        public static com.aliyun.ocr_api20210707.Client createClient(String accessKeyId, String accessKeySecret) throws Exception {
            com.aliyun.teaopenapi.models.Config config = new com.aliyun.teaopenapi.models.Config()
                    // 必填,您的 AccessKey ID
                    .setAccessKeyId(accessKeyId)
                    // 必填,您的 AccessKey Secret
                    .setAccessKeySecret(accessKeySecret);
            // 访问的域名
            config.endpoint = "ocr-api.cn-hangzhou.aliyuncs.com";
            return new com.aliyun.ocr_api20210707.Client(config);
        }

        public static void main(String[] args_) throws Exception {
            java.util.List<String> args = java.util.Arrays.asList(args_);
            // 初始化 Client,采用 AK&SK 鉴权访问的方式,此方式可能会存在泄漏风险,建议使用 STS 方式。鉴权访问方式请参考:https://help.aliyun.com/document_detail/378657.html
            // 获取 AK 链接:https://usercenter.console.aliyun.com
            com.aliyun.ocr_api20210707.Client client = RecognizeIdcardTest.createClient("AccessKeyId", "accessKeySecret");
            com.aliyun.ocr_api20210707.models.RecognizeIdcardRequest recognizeIdcardRequest = new com.aliyun.ocr_api20210707.models.RecognizeIdcardRequest()
                    .setUrl("https://img.alicdn.com/tfs/TB1q5IeXAvoK1RjSZFNXXcxMVXa-483-307.jpg");
            com.aliyun.teautil.models.RuntimeOptions runtime = new com.aliyun.teautil.models.RuntimeOptions();
            try {
                // 复制代码运行请自行打印 API 的返回值
                RecognizeIdcardResponse recognizeIdcardResponse = client.recognizeIdcardWithOptions(recognizeIdcardRequest, runtime);
                //打印返回数据
                System.out.println(new Gson().toJson(recognizeIdcardResponse));


            } catch (TeaException error) {
                // 如有需要,请打印 error
                com.aliyun.teautil.Common.assertAsString(error.message);
            } catch (Exception _error) {
                TeaException error = new TeaException(_error.getMessage(), _error);
                // 如有需要,请打印 error
                com.aliyun.teautil.Common.assertAsString(error.message);
            }
        }

}
  • 测试结果
{"headers":{"access-control-allow-origin":"*","date":"Thu, 17 Nov 2022 08:01:02 GMT","transfer-encoding":"chunked","vary":"Accept-Encoding","x-acs-request-id":"D70CEC76-7BC5-5528-A3AF-70B8B028F949","connection":"keep-alive","content-type":"application/json;charset\u003dutf-8","x-acs-trace-id":"873340aa87af04fa65ecfe6c189e282f"},"statusCode":200,"body":{"data":"{\"algo_version\":\"0122410b9bb1f2a16e432e55d491b446b16e1600\",\"data\":{\"face\":{\"algo_version\":\"0122410b9bb1f2a16e432e55d491b446b16e1600\",\"angle\":0,\"data\":{\"name\":\"方大呆\",\"sex\":\"女\",\"ethnicity\":\"汉\",\"birthDate\":\"2006年10月2日\",\"address\":\"上海市西藏南路-瞿溪路弘辉名苑\",\"idNumber\":\"371002200610020000\"},\"ftype\":0,\"height\":307,\"orgHeight\":307,\"orgWidth\":483,\"prism_keyValueInfo\":[{\"key\":\"name\",\"keyProb\":100,\"value\":\"方大呆\",\"valuePos\":[{\"x\":82,\"y\":40},{\"x\":142,\"y\":40},{\"x\":142,\"y\":60},{\"x\":82,\"y\":60}],\"valueProb\":100},{\"key\":\"sex\",\"keyProb\":100,\"value\":\"女\",\"valuePos\":[{\"x\":85,\"y\":77},{\"x\":104,\"y\":77},{\"x\":104,\"y\":96},{\"x\":85,\"y\":96}],\"valueProb\":100},{\"key\":\"ethnicity\",\"keyProb\":100,\"value\":\"汉\",\"valuePos\":[{\"x\":192,\"y\":75},{\"x\":212,\"y\":75},{\"x\":212,\"y\":95},{\"x\":192,\"y\":95}],\"valueProb\":100},{\"key\":\"birthDate\",\"keyProb\":100,\"value\":\"2006年10月2日\",\"valuePos\":[{\"x\":76,\"y\":116},{\"x\":214,\"y\":116},{\"x\":214,\"y\":131},{\"x\":76,\"y\":131}],\"valueProb\":100},{\"key\":\"address\",\"keyProb\":100,\"value\":\"上海市西藏南路-瞿溪路弘辉名苑\",\"valuePos\":[{\"x\":73,\"y\":154},{\"x\":278,\"y\":154},{\"x\":278,\"y\":196},{\"x\":73,\"y\":196}],\"valueProb\":100},{\"key\":\"idNumber\",\"keyProb\":100,\"value\":\"371002200610020000\",\"valuePos\":[{\"x\":162,\"y\":256},{\"x\":379,\"y\":256},{\"x\":379,\"y\":274},{\"x\":162,\"y\":274}],\"valueProb\":100}],\"sliceRect\":{\"x0\":0,\"y0\":0,\"x1\":482,\"y1\":0,\"x2\":483,\"y2\":307,\"x3\":0,\"y3\":307},\"width\":483}},\"height\":307,\"orgHeight\":307,\"orgWidth\":483,\"width\":483}","requestId":"D70CEC76-7BC5-5528-A3AF-70B8B028F949"}}

更多参考

新手指引
开发指南

目录
相关文章
|
2天前
|
文字识别 JavaScript Java
印刷文字识别产品使用合集之阿里云文字识别OCR demo主要有哪些
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
138 0
|
3天前
|
机器学习/深度学习 文字识别 监控
印刷文字识别产品使用合集之在OCR中,识别增值税专用发票的时候为什么会把不含税金额做取整处理
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
16 2
|
3天前
|
文字识别 JavaScript 前端开发
印刷文字识别产品使用合集之在OCR中,可以使用平台给的AppKey、AppSecret、AppCode进行调用吗
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
10 1
|
3天前
|
文字识别
印刷文字识别产品使用合集之OCR调用为什么会失败
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
8 1
|
4天前
|
JSON 文字识别 算法
C# 通过阿里云 API 实现企业营业执照OCR识别
C# 通过阿里云 API 实现企业营业执照OCR识别
|
4天前
|
弹性计算 运维 监控
解密阿里云弹性计算:探索云服务器ECS的核心功能
阿里云ECS是核心计算服务,提供弹性云服务器资源,支持实例按需配置、集群管理和监控,集成安全防护,确保服务稳定、安全,助力高效业务运营。
81 0
|
4天前
|
存储 弹性计算 固态存储
阿里云服务器CPU内存配置详细指南,如何选择合适云服务器配置?
阿里云服务器配置选择涉及CPU、内存、公网带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型e实例,如2核2G3M配置,适合低流量网站。企业用户则应选择企业级独享型ECS,如通用算力型u1、计算型c7或通用型g7,至少2核4G配置,公网带宽建议5M,系统盘可选SSD或ESSD云盘。选择时考虑实际应用需求和性能稳定性。
149 6
|
4天前
|
域名解析 弹性计算 Linux
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
本文为大家介绍了2024年购买阿里云服务器和注册域名,绑定以及备案的教程,适合需要在阿里云购买云服务器、注册域名并备案的用户参考,新手用户可通过此文您了解在从购买云服务器到完成备案的流程。
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
|
2天前
|
存储 安全 数据库
阿里云服务器计算型、通用型、内存型主要实例规格特点、适用场景及最新价格参考
在阿里云服务器的实例规格中,有共享型也有企业型,一般用户选择较多的企业级实例规格有计算型、通用型、内存型,每一种实例规格又有多个实例规格族可选,不同的云服务器实例规格在架构、计算、存储、网络、安全等方面有着不同,因此,其适用场景也有所不同。本文来详细介绍一下阿里云服务器计算型、通用型、内存型主要实例计算、存储等性能及其适用场景,以供参考。
阿里云服务器计算型、通用型、内存型主要实例规格特点、适用场景及最新价格参考
|
4天前
|
存储 弹性计算 固态存储
阿里云服务器租用价格参考,云服务器收费标准与实时活动价格整理
阿里云服务器租用价格参考,本文更新了阿里云服务器最新的租赁费用,包括云服务器实时的活动价格与云服务器收费标准。经济型e实例云服务器4核16G10M带宽配置30.00元/1个月、90.00元/3个月,独享型通用算力型u1实例2核4G服务器仅需199元1年,轻量云服务器2核2G新用户专享价格61元/1年,计算型c7a实例2核4G配置特惠价625.68元/1年。更多阿里云服务器热门配置活动价格及云服务器租赁费用及活动价格见下文。
阿里云服务器租用价格参考,云服务器收费标准与实时活动价格整理

热门文章

最新文章

http://www.vxiaotou.com