前言

OpenCV (Open Source Computer Vision Library) 是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它主要由 C++ 语言编写,同时提供了Python、Ruby、MATLAB、Java等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法,同时一个使用CUDA的GPU接口也于2010年9月开始实现。

该库拥有 2500 多个优化算法,其中包括一套全面的经典和最先进的计算机视觉和机器学习算法。这些算法可用于检测和识别人脸、识别对象、对视频中的人类行为进行分类、跟踪摄像机移动、跟踪移动对象、提取对象的 3D 模型、从立体摄像机生成 3D 点云、将图像拼接在一起生成整个场景的高分辨率图像,从图像数据库中查找相似图像,从使用闪光灯拍摄的图像中删除红眼,跟踪眼睛运动,识别风景,并建立标记以覆盖其增强现实等。

除了谷歌、微软、英特尔、IBM、索尼、等老牌公司,还有许多初创公司,它们广泛使用OpenCV。

阅读全文 »

建表规约

  1. 【强制】 表达是与否概念的字段,必须使用is_xxx 的方式命名,数据类型是unsigned tinyint (1表示是,0表示否)。

    说明: 任何字段如果为非负数,必须是unsigned

    注意: POJO类中的任何布尔类型的变量,都不要加is前缀,所以,需要在设置 从is_xxxXxx的映射关系。数据库表示是与否的值,使用tinyint类型,坚持is_xxx的命名方式是为了明确其取值含义与取值范围。

    正例: 表达逻辑删除的字段名is_deleted,1 表示删除,0 表示未删除。

  2. 【强制】 表名、字段名必须使用小写字母或数字,禁止出现数字开头,禁止两个下划线中间只出现数字。数据库字段名的修改代价很大,因为无法进行预发布,所以字段名称需要慎重考虑。

    说明: MySQLWindows下不区分大小写,但在Linux下默认是区分大小写。因此,数据库名、表名、字段名,都不允许出现任何大写字母,避免节外生枝。

    正例: aliyun_adminrdc_configlevel3_name

    反例:AliyunAdminrdcConfiglevel_3_name

  3. 【强制】 表名不使用复数名词。

    说明: 表名应该仅仅表示表里面的实体内容,不应该表示实体数量,对应于DO类名也是单数形式,符合表达习惯。

  4. 【强制】 禁止保留字,如descrangematchdelayed等,请参考MySQL官方保留字。

  5. 【强制】 主键索引名为pk_字段名;唯一索引名为uk_字段名;普通索引名则为 idx_字段名

    说明: pk_primary keyuk_unique key;idx_index的简称。

  6. 【强制】 小数类型为decimal,禁止使用floatdouble

    说明: floatdouble 在存储的时候,存在精度损失的问题,很可能在值的比较时,得到不正确的结果。如果存储的数据范围超过 decimal 的范围,建议将数据拆成整数和小数分开存储。

  7. 【强制】 如果存储的字符串长度几乎相等,使用 char 定长字符串类型。

  8. 【强制】 varchar 是可变长字符串,不预先分配存储空间,长度不要超过 5000,如果存储长度大于此值,定义字段类型为 text,独立出来一张表,用主键来对应,避免影响其它字段索引效率。

  9. 【强制】 表必备三字段:id, gmt_create, gmt_modified

    说明: 其中id必为主键,类型为bigintunsigned、单表时自增、步长为1。gmt_create, gmt_modified 的类型均为 datetime 类型,前者现在时表示主动创建,后者过去分词表示被动更新。

  10. 【推荐】 表的命名最好是加上“业务名称_表的作用”。

    正例: alipay_task / force_project / trade_config

  11. 【推荐】 库名与应用名称尽量一致。

  12. 【推荐】 如果修改字段含义或对字段表示的状态追加时,需要及时更新字段注释。

  13. 【推荐】 字段允许适当冗余,以提高查询性能,但必须考虑数据一致。

    冗余字段应遵循:

    • 不是频繁修改的字段。
    • 不是 varchar 超长字段,更不能是 text 字段。

    正例: 商品类目名称使用频率高,字段长度短,名称基本一成不变,可在相关联的表中冗余存储类目名称,避免关联查询。

  14. 【推荐】 单表行数超过 500 万行或者单表容量超过 2GB,才推荐进行分库分表。

    说明: 如果预计三年后的数据量根本达不到这个级别,请不要在创建表时就分库分表。

  15. 【参考】 合适的字符存储长度,不但节约数据库表空间、节约索引存储,更重要的是提升检索速度。

    正例: 如下表,其中无符号值可以避免误存负数,且扩大了表示范围。

对象年龄区间类型字节表示范围
150岁之内tinyint unsigned1无符号值:0 到 255
数百岁smallint unsigned2无符号值:0 到 65535
恐龙化石数千万年int unsigned4无符号值:0 到约 42.9 亿
太阳约50亿年bigint unsigned8无符号值:0 到约 10 的 19 次方

索引规约

阅读全文 »

前言

最近总结了Java处理图片的一些方法,特此分享下。

其中主要涉及到2种不同的类包。

一种是Java自带的ImageIOGraphics2DBufferedImage等类的使用;另一种是使用了net.coobird.thumbnailator包下的图片相关类。

阅读全文 »