用PHP的FFI调用cjieba

phpjieba_ffi

使用PHP 7.4的 FFI 测试直接调用cjieba分词的动态库

选用CJieba的原因是FFI使用的是C的调用约定,如果用Cpp,还得自己包装一下,然后extern C,让编译器生成标准C的动态库。

碰到的问题

段错误

C变量没有初始化

直接调用了C的函数,没有通过FFI 初始化后的的C对象调用

非空判断 需要使用 FFI::isNull($x)

指针形式的数组 不能用foreach

指针形式数组的循环

查看C代码发现Cut部分如下:

CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {
  cppjieba::Jieba* x = (cppjieba::Jieba*)handle;
  vector<string> words;
  string s(sentence, len);
  x->Cut(s, words);
  
  CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));
  size_t offset = 0;
  for (size_t i = 0; i < words.size(); i++) {
    res[i].word = sentence + offset;
    res[i].len = words[i].size();
    offset += res[i].len;
  }
  if (offset != len) {
    free(res);
    return NULL;
  }
  res[words.size()].word = NULL;
  res[words.size()].len = 0;
  return res;
}

返回的是一个结构体指针,在C语言里,数组名实际是数组第一个变量的指针地址,所以可以通过指针地址++的操作来遍历,在FFI里面呢?

对于这个数组,我一开始用foreach 循环,直接报段错误了,后来和C一样,直接用指针++,发现是可行的,这里给FFI点赞,居然也可以直接操作C指针。

分词结果获取

如上面的代码,对于单个分词CJiebaWord,也不是保存的分词,而是sentence + offset,就是说第一个分词结果肯定是原始字符串。

在C的demo里是printf格式化(. 表示字段宽度和对齐),但是PHP里没有类似的方法,需要截取字符串substr($x->word, 0, $x->len)

  for (x = words; x->word; x++) {
    printf("%*.*s\\n", x->len, x->len, x->word);
  }

用法示例

编译动态库

make libjieba.so

运行

time php demo.php

运行c demo

make demo
time ./demo

结果

PHP
load: 0.00025701522827148
real    1m59.619s
user    1m56.093s
sys     0m3.517s
C
real    1m54.738s
user    1m50.382s
sys     0m4.323s
CPU 占用 基本都是 12%

可以发现使用FFI,PHP的速度基本和C差不多,如有CPU占用大的业务,可以尝试使用其它语言(C/C++,golang,Rust等)编写然后导出标准C的动态库。

FFI的用途

在没有FFI之前,需要系统调用或者sdk方式调用的地方,PHP就需要开发扩展,但是开发扩展不仅需要理解C语言,还得了解PHP内核,比较困难。 现在就方便多了,直接使用FFI调用动态库即可。

扩展 宏展开

比如海康的sdk里有大量的宏 gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h 支持 type define 放心使用

关于用PHP的FFI调用cjieba的文章就分享到这,如果对你有帮助欢迎继续关注我们哦

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/41786.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
php学习php学习订阅用户
上一篇 2022年6月23日 16:30
下一篇 2022年6月23日 16:30

相关推荐

  • 我来分享服务器搭建php环境。

    一、搭建PHP网站的基本步骤 1. 安装Web服务器:首先需要在Windows系统上安装一个Web服务器,如Apache或Nginx,这里以Apache为例,下载对应的安装包,解压到指定目录,然后配置环境变量。 2. 安装PHP:从官网下载对应…

    2024年6月18日
    02
  • php位运算符的说明

    说明:作为了解的东西,就是对位进行操作,位说的是二进制的每个“位”,二进制共有32位。 位:由1和0构成 &:按位与 1 & 1 =>>>1 1 & 0 =>>>0 0 & 1 =>>>0 0 & 0 =&…

    2017年12月8日
    0227
  • php如何使用Slim框架。

    PHP如何使用Slim框架?在现代的Web开发中,框架是一种非常重要的工具,可以使得我们的开发更加高效和规范,能够更好的处理请求响应的逻辑和数据。而在众多框架中,Slim框架凭借其简洁、快速、灵活和易于学习的特点…

    2023年6月3日
    010
  • 使用PHP和MySQL进行数据备份的最佳实践。

    随着企业信息化水平的不断提高,数据备份已经成为了每个企业必须重视的问题。在备份数据的过程中,使用PHP和MySQL进行数据备份已经成为了备受推崇的最佳实践。PHP是一种开源服务器端脚本语言,其拥有简单易学、灵活…

    2023年5月28日
    03
  • PHP实现MySQL主从复制自动切换的方法。

    在现代化的应用架构中,数据库是至关重要的一环,对于高负载和高可用性应用,MySQL主从复制架构是广泛采用的一种解决方案。但是在MySQL主从复制模型下,主节点发生故障后需要手动切换从节点为主节点,这不仅会造成…

    2023年5月21日
    015
  • 分享php计算字符串长度。

    在PHP中,计算字符串长度的方法有很多,下面我们将介绍一些常用的方法。 1. strlen()函数:这是一个非常直接的函数,用于获取字符串的长度,它的使用方法如下: echo strlen("Hello World"); // 输出11 2…

    2024年6月16日
    00
  • 如何使用PHP实现微信小程序中的进度条和组件。

    随着微信小程序的不断普及,越来越多的开发者开始关注微信小程序的开发。在微信小程序中,进度条和组件通常用于提高用户体验和界面美观度。本文将介绍如何使用PHP实现微信小程序中的进度条和组件。一、进度条使用HT…

    2023年6月3日
    02
  • PHP入门指南:字符串。

    PHP是一种广泛使用的服务器端脚本语言,它强大的字符串处理功能是其受欢迎的原因之一。本文将介绍PHP字符串的基础知识以及常见的字符串操作。什么是字符串?在计算机编程中,字符串是由一系列字符组成的数据类型。…

    2023年5月22日
    05

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息