PPython:PHP 拥抱 Python 的利器 | Linux 中国

2019 年 5 月 15 日 Linux中国
PPython,这是一种从根本上将 PHP 与 Python 有效结合的技术。
-- 望星星降

作者:望星星降

介绍

Python 与 PHP 都是广泛使用的语言,各有所长,让人期待两者结合可以实现更丰富的效果。

在 PHP 中调用 Python 实现某些处理,这种需求虽然比较小众,还是实用的。目前网上可以查到很多资料仍在探讨 exec()(也包括 system()shell_exec()passthru()等)执行外部的 Python 文件,但这只是一种通用的方式,调用成本比较高,在每次调用时,需要装载整个 Python 解释环境。

有此类需求的开发者非常适合看一下 PPython,这是一种从根本上将 PHP 与 Python 有效结合的技术。

PPython 最初见于 https://code.google.com/p/ppython,该作者将 lajp(一种 PHP 结合 Java 的技术)移植到了 Python 上。

该项目最初建立于 2012 年,而且似乎已经停止维护多年,不过目前来看其思路及效果还是值得肯定的,因此将此项目从停止运营的 Google Code 上迁移到了 GitHub,并遵循原 Apache 许可证重新发布和维护。

日前笔者对此作了一番尝试,对 PPython 的方便易用有所体会。

原理与架构

PHP 与 Python 通讯有两种不同的套接字机制:TCP 套接字和 UNIX 套接字。UNIX 套接字是 Unix/Linux 本地套接字,相对于 TCP 套接字,具有以下特点:

◈ 只能在同一台主机中通讯(IPC),不能跨主机;
◈ 传输速度大于 TCP 套接字;
◈ 服务端只向本机提供服务(没有对外侦听端口),相对安全,易于管理。

PHP 和 Python 各有其语言内部定义的数据类型,通常 PHP 进程与 Python 进程进行数据交互时,需要进行转码处理。此类转换如由应用自行实现,从开发效率到运行性能都会增加不少额外负担。

PPython 对 PHP 和 Python 间的通讯方式的处理支持 TCP 套接字和 UNIX 套接字两种机制,兼顾通讯效率和分布式,转码由服务统一处理,Python 为 PHP 的数据类型提供格式兼容,使 PHP 端开发无须为底层通讯担心。

Python 因其语言 GIL 特性,同一进程内多线程效率不高。PPython 可根据项目需要部署服务,多进程运行 Python,提高应用综合性能。

使用方法

PPython 的代码可从上述项目仓库中下载。

下载得到的文件中,以下三个是 PPython 的核心代码,作用如下:

◈  php_python.py,Python 进程主文件,完成 Python 端监听请求并运行返回
◈  process.py,Python 端核心类,实现 Python 内部进程调用及 PHP 与 Python 数据结构转化等关键处理
◈  php_python.php,PPython 客户端,PHP 端引用此文件,可直接使用 PPython 函数实现调用。

将以上文件放置到任意目录。先修改准备运行 PPython 的端口,监听端口不限,只要 php_python.py 和 php_python.php 两端修改一致。笔者统一改为 10240。

在当前目录下运行 php_python.py,只要 Python 环境正常,便将运行起一个 PPython 的服务。

   
   
     
  1. -------------------------------------------
  2. - PPython Service
  3. - Time: 2019-05-13 22:24:09
  4. -------------------------------------------
  5. Listen port: 10240
  6. charset: utf-8
  7. Server startup...

PHP 端引入 php_python.php,就可以用 ppython 函数与之前启动的 PPython 服务通讯,传入请求由 PPython 服务调用 Python 处理后返回结果,如 $res = ppython('test::go') 是调用test.py 中的 go 函数,也可加上更多参数,第二个参数起将为被调的函数传递更多参数。

php_python.py 是 PPython 启动后直接运行的全局代码,有全局配置或进程启动后的通用处理都写在这里,如原生代码中建立了数据库连接等,项目中应视情况作优化。

但 Python 令人感兴趣的主要方面不只是像 PHP 那样描述业务功能,它可以在人工智能等领域所需要的计算型任务提供对更复杂的数据结构的处理,因此二者的结合可以给 PHP 带来更多应用场景。

改进

此外,原生的 php_python.py 还有些不足。笔者用 ppython 调用自定义代码中遇到了三个问题,并相应做了解决:

1.  不支持  complex (复数类),复数是数学上的一种数据类型,主要包括  real (实部)和  imag (虚部)数据,虽然日常生活中遇到较少,但 AI 和各种专业研究领域或并不罕见。Python 里有  complex  类,对复数可以直接进行各种计算,但  PPython  序列化和反序列化对  complex  没有处理。为了能让  complex  包括的数据能正常返回,只要在  process.py  的  z_encode()  方法中加上符合 PHP 要求的序列化处理,代码如下:
     
     
       
  1. elif isinstance(p, numpy.complex128):
  2. t1 = str(p.real)
  3. t2 = str(p.imag)
  4. return 'O:7:"complex":2:{s:4:"real";d:%s;s:4:"imag";d:%s;}' % (t1,t2)
2.  不支持  ndarray (多维数组)。相比  complex ndarray  要普通得多,相信凡使用到 Python 的各种计算功能, ndarray  是无法回避的,甚至  ndarray  在一定程度上成就了 Python。但原  php_python.py  不能识别  ndarray 。不过解决起来并不难,在  process.py  里找到 z_encode()  方法,加上下面这段,可以直接将  ndarray  转化为符合 PHP 要求的数组(数字索引)。 
     
     
       
  1. elif isinstance(p, numpy.ndarray):
  2. s = ''
  3. i = 0
  4. for d in p:
  5. s += 'i:%d;%s' % (i,z_encode(d))
  6. i += 1
  7. return "a:%d:{%s}" % (len(p),s)
3.  原代码不太稳健,如数据为  ndarray  类型, if p == None: 报错 ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all() ,因为 p == None 的结果也是 ndarray ,不返回 false  ,将判断方法改为 if p is None: 可避免出错。

相应地 PHP 端也要注意一下序列化和反序列化的处理。

处理回复中类似 complex 这样的对象数据时,如系统中没有定义相应的类,PHP 是可以反序列化的,但将显示为 “incomplete object”,vardump 看得到 real 和 imag 数据,但不能直接操作,自行定义 complex 类后,则按指定的类进行解析,与 PHP 内的一般对象无异,可以轻松进行所有操作。

至此,PHP 与 Python 的功能调讯已无问题。

补充:注册为服务

命令行下启动 php_python.py 主要是方便调试,可以看到观察反馈信息等,生产环境中手工启动 PPython 毕竟不太方便。可以将 PPython 配置成服务,修改端口也可以为不同的应用配置不同的 PPython 端。

Linux 下将一个进程注册为服务很简单,只要建立 /usr/lib/systemd/system/ppython.service,内容如下:

   
   
     
  1. [Unit]
  2. Description=PHP-Python Service
  3. After=network.target remote-fs.target nss-lookup.target
  4. [Service]
  5. ExecStart={PPYTHON_PATH}/php_python.py
  6. [Install]
  7. WantedBy=multi-user.target

其中 {PPYTHON_PATH} 要改成实际路径。

总结

有了 PPython,可以摒弃 exec() 这种 shell 调用,使开发回归到逻辑本身。

个人认为该方案值得所有对 PHP 和 Python 都感兴趣的开发人员了解,也欢迎大家参与和贡献这个项目。


登录查看更多
0

相关内容

PHP 是英文超级文本预处理语言(PHP:Hypertext Preprocessor)的缩写。PHP 是一种 HTML 内嵌式的语言,是一种在服务器端执行的嵌入 HTML 文档的脚本语言,语言的风格有类似于 C 语言,被广泛的运用。PHP 具有非常强大的功能,所有的 CGI 的功能 PHP 都能实现,而且支持几乎所有流行的数据库以及操作系统。
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
234+阅读 · 2020年5月21日
Python导论,476页pdf,现代Python计算
专知会员服务
259+阅读 · 2020年5月17日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
【干货书】流畅Python,766页pdf,中英文版
专知会员服务
224+阅读 · 2020年3月22日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
179+阅读 · 2020年1月1日
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
19+阅读 · 2019年10月28日
Python 3.8.0来了!
数据派THU
5+阅读 · 2019年10月22日
34个最优秀好用的Python开源框架
专知
9+阅读 · 2019年3月1日
Python用法速查网站
Python程序员
17+阅读 · 2018年12月16日
Python3.8新特性概览
Python程序员
4+阅读 · 2018年12月8日
干货 | Python 爬虫的工具列表大全
机器学习算法与Python学习
10+阅读 · 2018年4月13日
Python 杠上 Java、C/C++,赢面有几成?
CSDN
6+阅读 · 2018年4月12日
Python为啥这么牛?
Python程序员
3+阅读 · 2018年3月30日
Python NLP 入门教程
开源中国
14+阅读 · 2017年10月1日
Arxiv
29+阅读 · 2020年3月16日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
6+阅读 · 2018年7月12日
Arxiv
5+阅读 · 2018年1月18日
VIP会员
相关VIP内容
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
234+阅读 · 2020年5月21日
Python导论,476页pdf,现代Python计算
专知会员服务
259+阅读 · 2020年5月17日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
【干货书】流畅Python,766页pdf,中英文版
专知会员服务
224+阅读 · 2020年3月22日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
179+阅读 · 2020年1月1日
相关资讯
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
19+阅读 · 2019年10月28日
Python 3.8.0来了!
数据派THU
5+阅读 · 2019年10月22日
34个最优秀好用的Python开源框架
专知
9+阅读 · 2019年3月1日
Python用法速查网站
Python程序员
17+阅读 · 2018年12月16日
Python3.8新特性概览
Python程序员
4+阅读 · 2018年12月8日
干货 | Python 爬虫的工具列表大全
机器学习算法与Python学习
10+阅读 · 2018年4月13日
Python 杠上 Java、C/C++,赢面有几成?
CSDN
6+阅读 · 2018年4月12日
Python为啥这么牛?
Python程序员
3+阅读 · 2018年3月30日
Python NLP 入门教程
开源中国
14+阅读 · 2017年10月1日
相关论文
Top
微信扫码咨询专知VIP会员