用PHP的FFI调用cjieba

phpjieba_ffi

使用PHP 7.4的 FFI 测试直接调用cjieba分词的动态库

选用CJieba的原因是FFI使用的是C的调用约定,如果用Cpp,还得自己包装一下,然后extern C,让编译器生成标准C的动态库。

碰到的问题

段错误

C变量没有初始化

直接调用了C的函数,没有通过FFI 初始化后的的C对象调用

非空判断 需要使用 FFI::isNull($x)

指针形式的数组 不能用foreach

指针形式数组的循环

查看C代码发现Cut部分如下:

CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {
  cppjieba::Jieba* x = (cppjieba::Jieba*)handle;
  vector<string> words;
  string s(sentence, len);
  x->Cut(s, words);
  
  CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));
  size_t offset = 0;
  for (size_t i = 0; i < words.size(); i++) {
    res[i].word = sentence + offset;
    res[i].len = words[i].size();
    offset += res[i].len;
  }
  if (offset != len) {
    free(res);
    return NULL;
  }
  res[words.size()].word = NULL;
  res[words.size()].len = 0;
  return res;
}

返回的是一个结构体指针,在C语言里,数组名实际是数组第一个变量的指针地址,所以可以通过指针地址++的操作来遍历,在FFI里面呢?

对于这个数组,我一开始用foreach 循环,直接报段错误了,后来和C一样,直接用指针++,发现是可行的,这里给FFI点赞,居然也可以直接操作C指针。

分词结果获取

如上面的代码,对于单个分词CJiebaWord,也不是保存的分词,而是sentence + offset,就是说第一个分词结果肯定是原始字符串。

在C的demo里是printf格式化(. 表示字段宽度和对齐),但是PHP里没有类似的方法,需要截取字符串substr($x->word, 0, $x->len)

  for (x = words; x->word; x++) {
    printf("%*.*s\\n", x->len, x->len, x->word);
  }

用法示例

编译动态库

make libjieba.so

运行

time php demo.php

运行c demo

make demo
time ./demo

结果

PHP
load: 0.00025701522827148
real    1m59.619s
user    1m56.093s
sys     0m3.517s
C
real    1m54.738s
user    1m50.382s
sys     0m4.323s
CPU 占用 基本都是 12%

可以发现使用FFI,PHP的速度基本和C差不多,如有CPU占用大的业务,可以尝试使用其它语言(C/C++,golang,Rust等)编写然后导出标准C的动态库。

FFI的用途

在没有FFI之前,需要系统调用或者sdk方式调用的地方,PHP就需要开发扩展,但是开发扩展不仅需要理解C语言,还得了解PHP内核,比较困难。 现在就方便多了,直接使用FFI调用动态库即可。

扩展 宏展开

比如海康的sdk里有大量的宏 gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h 支持 type define 放心使用

关于用PHP的FFI调用cjieba的文章就分享到这,如果对你有帮助欢迎继续关注我们哦

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/41786.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
php学习php学习订阅用户
上一篇 2022年6月23日 16:30
下一篇 2022年6月23日 16:30

相关推荐

  • PHP中的函数式编程实践。

    随着现代技术的快速发展,PHP作为一种广泛使用的编程语言,在开发过程中也需要不断升级其技术和应用。其中,函数式编程的概念和实践逐渐变得越来越重要。先从概念入手,函数式编程是一种思想范式,其特点是将函数看…

    2023年5月30日
    03
  • php的算术运算符与赋值运算符

    说明:是+ - * / % 赋值运算符--= 说明:就是给变量赋值的作用。

    2017年12月2日
    0204
  • 如何在PHP中实现微信公众号菜单事件

    对于使用PHP开发微信公众号的开发者来说,实现微信公众号菜单事件是一个基本的需求。简单来说,菜单事件就是当用户点击微信公众号的菜单时,微信服务器会向开发者后台发送一个请求,开发者需要在后台处理该请求并返…

    2023年5月18日
    03
  • 关于lamp的搭建。

    搭建LAMP环境是创建基于Linux操作系统的服务器,安装Apache作为Web服务器,MySQL作为数据库管理系统以及PHP作为服务端脚本语言的过程,LAMP是一个流行的开源网站解决方案堆栈,被广泛用于构建和部署动态网站和应用…

    2024年7月22日
    05
  • PHP与Elasticsearch的集成

    PHP与Elasticsearch的集成随着大数据和数据挖掘的发展,搜索引擎已经成为了我们生活中必不可少的工具。而Elasticsearch就是一个快速、开放、可扩展的搜索和分析引擎,它能够轻松地进行全文检索、数据分析和实时数据…

    2023年5月19日
    05
  • php微信第三方实现一键登录及获取用户信息的方法(附代码)

    具体如下: 注意:要使用微信在第三方网页登录是需要“服务号”才可以哦,所以必须到官方申请。 一开始你需要进入微信公众平台开启开发模式,并且填写oauth2的回调地址,地址填写你项目的域名就可以了.比如:www.baidu.c…

    2018年3月2日
    0241
  • PHP中的MySQL操作指南。

    PHP是Web开发中最常用的编程语言之一,而MySQL则是最受欢迎的关系型数据库管理系统之一。在Web应用程序开发过程中,PHP的一个主要功能就是与MySQL数据库进行交互,以存储和检索数据。本文将为您提供一个基本的MySQL…

    2023年5月23日
    01
  • 三种php生成二维码的方法

    最简单最实例的goolge开源方法,不过反应有点慢1.google开放api代码如下:$urlToEncode="http://www.helloweba.com"; generateQRfromGoogle($urlToEncode); /** * google api 二维码生成【QRcode可以存储…

    2022年6月23日
    0145

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息