返利网app网站开发,织梦怎么做中英文双语网站,网站集约化建设的好处,网页设计学生实训报告总结最近遇到一个需求#xff1a;有大量的扫描件需要还原为可编辑的文本#xff0c;很显然需要用到图片OCR识别为文字技术。本来以为这个技术很普遍的#xff0c;结果用了几个开源库#xff0c;效果不理想。后来#xff0c;用了取巧的方法#xff0c;直接使用了WX的OCR识别模…最近遇到一个需求有大量的扫描件需要还原为可编辑的文本很显然需要用到图片OCR识别为文字技术。本来以为这个技术很普遍的结果用了几个开源库效果不理想。后来用了取巧的方法直接使用了WX的OCR识别模型因为发现WX电脑端的OCR识别真是黑科技啊好用的很识别率99.9%并且是本地识别不需要调用接口。放几张图片看看中文识别很强图片里很多干扰因素都自动屏蔽了厉害 简单用C# winforms实现了一下
public class ImageOcr
{public static void Run(string imagePath, Actionstring,WeiOcrResult callback){string wechatOcrDir Path.Combine(AppDomain.CurrentDomain.BaseDirectory, extracted\WeChatOCR.exe);string wechatDir AppDomain.CurrentDomain.BaseDirectory;OcrManager? ocrManager new OcrManager();var ocrPtr GCHandle.ToIntPtr(GCHandle.Alloc(ocrManager));ocrManager GCHandle.FromIntPtr(ocrPtr).Target as OcrManager;if (ocrManager ! null){ocrManager.SetExePath(wechatOcrDir);ocrManager.SetUsrLibDir(wechatDir);ocrManager.SetOcrResultCallback(callback);ocrManager.StartWeChatOCR(ocrPtr);ocrManager.DoOCRTask(imagePath);Thread.Sleep(1000);while (ocrManager.m_taskIdQueue.Count ! OcrManager.OCR_MAX_TASK_ID){// Wait for OCR tasks to completeThread.Sleep(100);}ocrManager.KillWeChatOCR();}}
}
获取全部源代码
参考链接https://www.cnblogs.com/slmk/p/18011420