发布时间:2024-01-13 | 阅读:
上期我们介绍了如何使用柏睿向量计算引擎1分钟实现以图搜图的功能,下面我们再来介绍柏睿向量计算引擎在图片处理上的其它能力。
准备工作
图片数据集:imagenet-1k 素材库中test数据集,共10万张图片,最小图片1K,最大图片9.1MB。
网址:https://huggingface.co/datasets/imagenet-1k
Embedding模型:CLIP-ViT-B-32-laion2B-s34B-b79K
网址:https://huggingface.co/laion/CLIP-ViT-B-32-laion2B-s34B-b79K
功能演示
1. 图片向量数据存储
每张图经过Embedding后存入柏睿向量计算引擎为固定长度2048B,相比最大的9.1MB原始图片,相当于将节省450,000%的存储空间。
如果再借助我们上期讲的以图搜图功能+柏睿流湖仓归档产品,为用户实现低成本的海量音视频存储解决方案。
2. 搜索准确度
在上期我们测试过以图搜图的能力,本次又对水果进行搜索,准确依然很高。
搜索图片:
搜索结果:完全正确
3. 搜索速度
我们依然和某国际知名向量数据库进行速度比较。
测试过程
1.使用CLIP-ViT-B-32-laion2B-s34B-b79K Embedding模型将imagenet-1k数据集的10万张图片向量化存入柏睿向量计算引擎中;
2.从互联网找一张图片,作为搜索图片;
3.使用搜索图片在柏睿向量计算引擎中连续搜索4次,取平均值作为最终查询结果。
柏睿向量计算引擎查询结果:
Faiss 查询时间:
从上面的结果数据看,柏睿向量计算引擎在10万张图片向量中的查询速度与某国际知名向量数据库不相伯仲。