最近发文章,偶然发现引用的部分三方链接展示出了特别效果:
跟进去发现对方也是用的WordPress,看了下源码,发现个关键词Embed,遂搜索了解了一下,百度百科的释义:
oEmbed 是一种允许第三方站点上 URL 的嵌入式表示的格式……当用户发布一个到某资源的[……]
最近发文章,偶然发现引用的部分三方链接展示出了特别效果:
跟进去发现对方也是用的WordPress,看了下源码,发现个关键词Embed,遂搜索了解了一下,百度百科的释义:
oEmbed 是一种允许第三方站点上 URL 的嵌入式表示的格式……当用户发布一个到某资源的[……]
Tesseract是一个支持多种操作系统OCR引擎,被认为是最精准的开源光学字符识别引擎之一。
在Linux下,命令行运行tesseract-ocr,结果是输出到result.txt文件的,如何直接在直接输出到命令行呢?毕竟直接输出的话,是可以调用后就得到结果的,省[……]
恩,目前Notepad++的7.7.1 32位版本,NppExport插件复制出来的代码不再拥有好看的高亮,而只是黑底白字的样式。
经过搜索了解到,是插件版本过低造成的问题,人工下载最新版本的插件NppExport_0.2.9.21_x86.zip,覆盖安装目录[……]
wkhtmltoimage是个不错的HTML转图片的工具,安装很简单:
下载困难的同学,可以人工下载wkhtmltox-0.12.5-1.centos6.x86_64.rpm安装。
wget https://downloads.wkhtmltopdf.org/0.1[......]旧版的系统,没办法直接yum安装,需要编译安装,编译起来挺麻烦的,所以整理了一下一把梭的流程,供后人参考:
如果下载相关文件太慢,或者无法下载,可以尝试人工下载:eng.traineddata,leptonica-1.78.0.tar.gz,tesseract-4.[……]
tesseract执行时出现这种提示,通常是leptonica编译安装的时候,缺少部分lib,比如libtiff。
我出现提示是在Amazon Linux AMI release 2018.03的系统中,解决方案也很简单:
yum install libtiff-[......]edge_ngram和ngram是ElasticSearch自带的两个分词器,一般设置索引映射的时候都会用到,设置完步长之后,就可以直接给解析器analyzer的tokenizer赋值使用。
但这两个分词器到底有什么区别呢?网上搜来搜去呢,都不是说人话的解释,如果不[……]
有时我们需要查找某个目录下的0字节文件,用什么方式进行查找呢?其实很简单,示例代码如下:
find "/tmp" -size 0上述代码执行后,会列出tmp目录下文件大小为0字节的文件。 如果要对文件进行处理的话,可以使用管道。
find[......]