PHP+MYSQL求一个高并发方案

longlong 更新于2023-07-14

问题描述

内网http接口，高并发，要求响应在100ms内，单机需要支持5000+ QPS。
请求参数为订单ID(数字int类型)，业务逻辑为判断本地数据库中订单是否存在，mysql大概100万条记录。
数据库中订单会随时增加，每天增加几百条。

服务器资源有限，越省资源越好。
php-fpm的框架都试过了，opcache全开最高也就200QPS左右，距离5000QPS相距甚远。
求一个高并发方案，现在打算用webman。redis能不用就不用。

用webman + bitmap完美解决 QPS 11万+，性能远远远元超预期，webman神一般的存在，详情见7楼回复。

 6267  17 53

17个回答

Dalong 2023-07-13

是我我就这样试试：

public function existsxx(Request $request){
if(Redis::exists($request->get(''oid)){
return 1;
}
// 查询库
....
}

暂无评论

roczyl 2023-07-13

为啥不用redis？

暂无评论

kspade 2023-07-13

哥们我这几天也是一样的需求

固定每秒500 - 1000 请求，数据库基础数据30万数据库每天新增几千数据

请求来时判断数据库中是否存在数据,数据内容为：（34 - 64位字符串）

webman 群友给我的建议是将数据同步给redis，从redis中判断（redis 理论每秒支持10万+查询并发）

一些开发群给我的建议是上GO JAVA （当然无视这些吊毛打心眼里看不起php）

neneoa 2024-02-08

区块链扫块？

nitron 2023-07-13

人啊,要认清现实,不要指着个正常的拖拉机要他跑出F1的速度
给结论,不想上各类缓存手段就堆硬件
MySQL查询走PK基本是最快的了,select * from tbl where pk = ?数据库查询内就几ms,算上网络消耗一来一回就二三十ms
我给你算个数据
FPM要5000qps,意味着1秒内要创建/销毁5000MySQL连接,问题在哪看到了么

暂无评论

箜篌 2023-07-14

想啥呢，高并发不上redis

暂无评论

tanhongbin 2023-07-14

直接查mysql 扛不住呀，redis 是最好的处理方案 bitmap 你可以尝试一下，这个理论最省redis内存，然后入库还是用队列最好，webman进程多开一切，理论 5000qps 没啥问题，最好是 webman 和 redis 在一个机器他们直接通信基本能做3ms以内，你可以试试

longlong 2023-07-14

压测了下，走数据库QPS能达到9000+了，就是cpu有点高，快80%了
TM 2023-07-14

他的业务好像只需要判断存在不存在，直接可以存redis里面判断就可以了吧？写入和修改另外处理了

six 2023-07-14

webman常驻内存的，直接走webman内存缓存数据，数据不存在时再走mysql，我们试过，性能无敌，架构也不用做什么改动。
代码类似这样，压测试下

<?php
namespace app\controller;

use support\Db;
use support\Request;

class IndexController
{
    // 缓存的数据
    protected static $data = [];

    public function index(Request $request)
    {
        $id = $request->get('id');
        return json(['result' => static::get($id)]);
    }

    protected static function get($id)
    {
        // 初始化缓存
        if (!static::$data) {
            ini_set('memory_limit', '512M');
            static::$data = array_flip(Db::table('orders')->pluck('id')->toArray());
        }
        // 缓存不存在则查数据库
        if (!isset(static::$data[$id])) {
            if (Db::table('orders')->find($id)) {
                // 订单存在继续缓存
                static::$data[$id] = 1;
                return true;
            }
            return false;
        }
        return true;
    }
}

这个方案就是有点费内存，但是性能那是真的好，比redis缓存快好几倍

nitron 2023-07-14

有情提示,记得开启控制器复用
six 2023-07-14

用的static静态变量，不用开控制器复用。当然开了性能更高
tanhongbin 2023-07-14

这种怎么说呢，就是有点耗费内存，实际如果redis和webman 通信内网基本还是redis bitmap比较好一个512M 的 key就够用了查询是（0）1,5000qps应该问题不大
nitron 2023-07-14

我单机应用缓存基本实现跟你差不多,缓存不用Redis,直接用内存
tanhongbin 2023-07-14

问题是你每个进程都得存全量数据了 100多万呢，10个进程就相当于内存中存了1000万数据呀，内存估计占用很大
nitron 2023-07-14

看情况,量大我存/dev/shm,多进程共享,写时加锁
tanhongbin 2023-07-14

这个很高级呀，没用过这个怎么写？？分享一下
longlong 2023-07-14

握了草，这个性能太爆表了，11W+ QPS，无以言表... 。就是有点占用内存，每个进程50M+
longlong 2023-07-14

即使不命中缓存都走MYSQL，QPS也有9000+ ...
nitron 2023-07-14

其实就是文件缓存,但是文件是直接写在内存里,dev/shm你可以当成RamDisk,因为是单机应用,所以也不在乎
主打一个简单...
tanhongbin 2023-07-14

怎么样 webman 猛不猛？吓一跳吧哈哈
nitron 2023-07-14

单机应用的前提下,APCu之类不走网络的缓存方式其实比Redis快很多
tanhongbin 2023-07-14

@longlong 之前没用过webman框架嘛？
longlong 2023-07-14

这性能没得说，我在想怎么把内存也降下去。内存再降下去就是几乎最完美的方案了。
longlong 2023-07-14

我尝试让AI给我写一个php版本的bitmap来解决
tanhongbin 2023-07-14

你这想法不错呀，哈哈
稚出 2023-07-14

既要..还要，不存在这种东西，要不就是时间换空间，要不就是空间换时间
TM 2023-07-14

没有又快又不占内存吧，总要用一样换取另一样

longlong 2023-07-14

让官方的AI帮忙写了个php版本的bitmap，完美解决内存占用问题，现在每个进程占用内存28M+(相比主进程就多了5M左右)，可缓存1000万订单id。webman真是牛逼，webman的AI也牛逼...

代码，各位参考下

<?php
namespace app\controller;

use support\Db;
use support\Request;

class IndexController
{
    protected static $bitmap;

    public function index(Request $request)
    {
        $id = $request->get('id');
        return json(['result' => static::get($id)]);
    }

    protected static function get($id)
    {
        if (!static::$bitmap) {
            static::$bitmap = new Bitmap(10000000);
            ini_set('memory_limit', '512M');
            $data = Db::table('orders')->pluck('id');
            foreach ($data as $order_id) {
                static::$bitmap->set($order_id, 1);
            }
        }
        return static::$bitmap->get($id);
    }
}

class Bitmap {

    protected $bitmap;

    public function __construct($num) {
        $this->bitmap = str_repeat("\x00", ceil($num / 8));
    }

    public function set($num, $value) {
        $byteIndex = intval(($num - 1) / 8);
        $bitIndex = ($num - 1) % 8;
        $byte = ord($this->bitmap[$byteIndex]);
        if ($value) {
            $byte |= (1 << $bitIndex);
        } else {
            $byte &= ~(1 << $bitIndex);
        }
        $this->bitmap[$byteIndex] = chr($byte);
    }

    public function get($num) {
        $byteIndex = intval(($num - 1) / 8);
        $bitIndex = ($num - 1) % 8;
        $byte = ord($this->bitmap[$byteIndex]);
        return (($byte >> $bitIndex) & 1) == 1;
    }
}

kspade 2023-07-14

@longlong 有个问题如果说订单ID 换成订单号呢？bitmap 是不是不适用了 (34-64位长度的字符串)
tanhongbin 2023-07-14

过长就肯定不适用了，不过你可以用布隆过滤器，让ai帮你写一个 php版本的布隆过滤器一样的
tanhongbin 2023-07-14

@longlong 你现在这么写 qps能有2W+ 嘛？
kspade 2023-07-14

注意，使用BloomFilter扩展需要先安装该扩展。你可以使用pecl命令来安装扩展，例如pecl install BloomFilter。安装完成后，你可以在PHP代码中使用BloomFilter类。

需要注意的是，布隆过滤器是一个概率型数据结构，因此在判断元素是否存在时，可能会出现一定的误判率。误判率取决于过滤器的大小和哈希函数的数量。在使用布隆过滤器时，需要根据实际情况来选择适当的过滤器大小和哈希函数数量，以平衡误判率和空间效率的要求。

这玩意有误差啊
tanhongbin 2023-07-14

其实看量大小，如果量不是很大，可以redis 集合是最简单的，不要在集合中查询，直接sadd 是最好的，这玩意效率高
longlong 2023-07-14

@tanhongbin webman+bitmap 也是11W QPS
tanhongbin 2023-07-14

这个有点猛呀，不过你新添加的数据怎么往bitmap里面放呀？
longlong 2023-07-14

不存在就读下数据库，然后set进去，上面忘记写了
tanhongbin 2023-07-14

哦哦，方案可以就是重启还得重新写，写一个系统重新启动，直接把数据全写进去，就完美了，还有哪个查表可以用省内存方式的那种写法
longlong 2023-07-14

@kspade 字符串类型的订单号没办法用bitmap，直接用 @six 的方案，30万订单占用50M内存，完全可以接受。
kspade 2023-07-14

@longlong
有点没看明白上面@six 的方案是否可以写成一个公用的class ，然后再各个控制器方法中调用？
还是说必须放在Controller 里面 protected static function get($id) 定义后调用
kspade 2023-07-14

我觉得@six 的是不是最佳方案也应该是在启动项目时，把x表内所有数据给缓存到内存中去？
longlong 2023-07-14

可以封装成公共类，@six的方案就是第一次请求时从数据库载入，也可以做成启动时就缓存到内存去。
tanhongbin 2023-07-14

最好是启动就把数据缓存到内存中，webman就能实现，里面有一个随着进程启动执行的类
kspade 2023-07-14

config/bootstrap.php 学习了，我去实践一下
kspade 2023-07-14

// 初始化缓存
if (!static::$data) {
ini_set('memory_limit', '512M');
static::$data = array_flip(Db::table('orders')->pluck('id')->toArray());
}

其中 Db::table('orders')->pluck('id')->toArray() 假设orders 表有100万条数据，这个语句应该要耗时挺久吧？我用think 感觉不利索呢
Dalong 2023-07-15

制器复用开跟不敢有啥区别？@six
longlong 2023-07-15

@kspade 我这阿里云服务器，本地部署的mysql，100万耗时1秒左右
天天聊天 2023-12-05

没有能力只能默默敬佩

雷子飞机的小乌龟 2023-07-14

按照订单后后缀做分表

nitron 2023-07-14

你认真的吗?瓶颈在哪里你都没弄清楚,才100万的数据你给说说分表?
kspade 2023-07-14

这个问题不是分表解决的。。。5000QPS每秒。。你分5000个表都没用。单MYSQL 链接销毁都给你干嗝屁。。
longlong 2023-07-14

php-fpm 每次请求都建立销毁MYSQL链接，性能太低了，我机器上只有200QPS

pader 2023-07-14

用 Wind Framework，你这每天几百条数据，单机 5000+ QPS 用这个框架，单个 HttpServer 进程轻轻松松，我们每天处理百万条数据，单机两个进程轻轻松松。

邬綵唔惪 2023-07-17

你们用wind Framework，用到不兼容的composer依赖，都是自己改造嘛？

happy321 2023-07-14

用webman V5的协程+redis 轻轻松松几十万QPS

tanhongbin 2023-07-14

这个协程 redis 为啥我用着干啥和直接用redis 没啥区别，性能感觉是一样的，因为redis足够快呀
happy321 2023-07-14

数据分块同时查
JackDx 2023-07-14

有时间写个demo嘛大佬~ 学习下
kspade 2023-07-14

分享例子携程怎么玩的我一直没搞懂
tanhongbin 2023-07-14

static public function httpRequest(string $url, string $method = 'GET', array $headers = [], array $data = [], bool $log = false) : string
{
$start_time = microtime(true);
$options = [
'max_conn_per_addr' => 128, // 每个域名最多维持多少并发连接
'keepalive_timeout' => 15, // 连接多长时间不通讯就关闭
'connect_timeout' => 30, // 连接超时时间
'timeout' => 30, // 请求发出后等待响应的超时时间
];
$http = new Client($options);
//$http = \support\Container::get('Workerman\Http\Client');
$postData = in_array('application/json',$headers)?json_encode($data):$data;
$response = $http->request($url, [
'method' => $method,
'version' => '1.1',
'headers' => $headers,
'data' => $postData,
]);
$end_time = microtime(true);
$res = $response->getBody()->getContents();
$logStr = json_encode(['url' => $url,'method' => $method,'response' => json_decode($res),'time' => ($end_time - $start_time) . 's']);
if($log) {
//第三方请求日志
Log::channel(self::$httplog)->info($logStr,$data);
}
return $res;
}
协程请求第三方接口的代码
tanhongbin 2023-07-14

前提是 composer "workerman/workerman": "v5.0.0-beta.5",
"revolt/event-loop": "1.0.1",
"workerman/http-client": "2.0.1",
这三个包

nitron 2023-07-14

我帮你美化下

static public function httpRequest(string $url, string $method = 'GET', array $headers = [], array $data = [], bool $log = false) : string
{
    $start_time = microtime(true);
    $options = [
        'max_conn_per_addr' => 128, // 每个域名最多维持多少并发连接
        'keepalive_timeout' => 15, // 连接多长时间不通讯就关闭
        'connect_timeout' => 30, // 连接超时时间
        'timeout' => 30, // 请求发出后等待响应的超时时间
    ];
    $http = new Client($options);
    //$http = \support\Container::get('Workerman\Http\Client');
    $postData = in_array('application/json',$headers)?json_encode($data):$data;
    $response = $http->request($url, [
        'method' => $method,
        'version' => '1.1',
        'headers' => $headers,
        'data' => $postData,
    ]);
    $end_time = microtime(true);
    $res = $response->getBody()->getContents();
    $logStr = json_encode(['url' => $url,'method' => $method,'response' => json_decode($res),'time' => ($end_time - $start_time) . 's']);
    if($log) {
        //第三方请求日志
        Log::channel(self::$httplog)->info($logStr,$data);
    }
    return $res;
}

tanhongbin 2023-07-14

我这个协程不一定正确，你们还是自己实现最好，万一不对就坑人了
kspade 2023-07-15

guzzle 好像自带有？
tanhongbin 2023-07-17

不是guzzle是workerman的http组件
xiaopi 2023-07-28

老哥这个注释了，是复用Client对象会出问题吗？//$http = \support\Container::get('Workerman\Http\Client');
tanhongbin 2023-07-28

不会我为了测试用的

oxiaohaio 2023-07-14

/*
//生成100万个文件
$start = microtime(true);
echo "wait for file creation... \r\n";
for($i = 1; $i < 1000000; $i++){
    file_put_contents('md5/' . md5($i), '');
}
$all_time = round((microtime(true) - $start) * 1000, 2);
echo $all_time . "all run time: $all_time ms \r\n";
//生成结束
*/

$start = microtime(true);
$query_num = 50000;
$s = md5(rand(1, 1000000)); 
for($i = 1; $i < $query_num; $i++){
    //$s = md5(rand(1, 1000000)); //放在这里随机查找,会慢一些
    $check_file = 'md5/' . $s;
    //$rs =file_get_contents($check_file);
    $rs = file_exists($check_file);
}

//总计运行时间(ms)
$all_time = round((microtime(true) - $start) * 1000, 2);
//单次运行时间(ms)
$single_time = round($all_time / $query_num, 4);
//1秒钟可以检测次数
$one_second_check_num = floor(1000 / $single_time);

echo "query num: $query_num \r\n";
echo "all run time: $all_time ms \r\n";
echo "single run time: $single_time ms \r\n";
echo "one second check num: $one_second_check_num\r\n";

先建立一个md5文件夹，把注释打开生成100万条订单数据
然后运行测试代码直接用文件检测

单订单号检测和随机订单号检测速度差距还是挺大的
但是可以满足楼主的需求

Linux服务器上实测也差不多

暂无评论

ontheway 2023-07-15

你这个开了多少进程？还有用的是什么软件压测的，我看你的压测时间太短了

暂无评论

胡桃 2023-07-15

静态变量保存bitmap，有两大弊端。一、数据库增删时，需要及时更新维护；二、消耗额外[bitmap容量*(子进程数-1)]的内存。
Redis保存bitmap，也有两个弊端，Redis运行需要内存，并且与其通信的成本巨大。

使用共享内存保存bitmap，既节省内存，又无IO。
https://www.php.net/manual/zh/book.shmop.php

kspade 2023-07-15

webman 上实践过没？
胡桃 2023-07-15

这东西早玩烂了，对于PHP来说，既要……又要……，这是唯一的办法。
kspade 2023-07-15

看了一下这个如果要存入100万数据，还是很麻烦啊，感觉就和tp的 cache 一样
胡桃 2023-07-15

何来跟tp的cache一样？shmop函数的唯一弊端是最小读写单元是8位，写入时可能需要加锁，但是锁字节即可，粒度很小，按楼主所言每日增加几百条，即使使用文件锁也毫无性能问题。
nitron 2023-07-16

单机应用用shm的性能真不是redis可以比的
kspade 2023-07-16

真羡慕你们懂那么多。我研究研究去，最近对这块正好有需求，
tanhongbin 2023-07-17

这玩意多思考，多想多测试啥都明白了
dignfei 2023-07-20

共享内存的缺点是需要序列化和反序列化，这个难道不是最慢的吗

kspade 2023-08-25

求教
要怎么初始化才可以在所有进程的控制器方法中使用？包括 redis 消费中可以调用判断是否存在

tanhongbin 2023-08-25

多思考，多尝试，多测试

软饭工程师 2023-08-25

参考文档https://www.workerman.net/doc/webman/others/bootstrap.html
初始化定义

    public static function start($worker)
    {
        // Is it console environment ?
        $is_console = !$worker;
        if ($is_console) {
            // If you do not want to execute this in console, just return.
//            return;
        }
        $userService = Container::get(UserService::class);

        $userService::$data = ['aaa', 'bbb', 'ccc'];

    }

读取初始化变量

    public function json(Request $request,UserService $userService)
    {
        return json(['code' => 0, 'msg' => 'ok', 'data' => $userService::$data]);
    }

定义静态变量

class UserService
{
    // 缓存的数据
    public static array $data = [];
}

测试结果

mac-mini ~ %
mac-mini ~ % curl http://127.0.0.1:8686/index/json
{"code":0,"msg":"ok","data":["aaa","bbb","ccc"]}%
mac-mini ~ %

xiaopi 2023-12-05

我有个问题哈，这种写法的话，对于新增或者删除的数据，无法跨进程啊。比如http开了8个进程处理订单号，自定义进程4个用于处理新增/删除的数据，这种如何更新8个http进程中的内存数据呢。

muvtou 2023-11-01

学习了

暂无评论

dangpengsong 2023-11-02

学习了

mark 2023-11-02

收藏一下

故人重来 2024-02-25

学习了

暂无评论

相关连接

求一个workerman 开发websocket的热更新方案

一个需求问题求提供方案(可打赏)

高并发场景下mysql连接连接数过多

求一个关于公交车扫码的方案

想用webman 实现一个方案,就像fast那样的功能模块化团队协作开发求方案案例

高并发推送

年代过于久远，无法发表回答

月贡献榜

赞助商

PHP+MYSQL求一个高并发方案

问题描述

17个回答

哥们我这几天也是一样的需求

月贡献榜

walkor

bangbangda

ichynul

za2883632

wzj177

赞助商

热门问答

基于workerman开发的在线客服系统源码

聊天系统源码,即时通讯聊天源码

PHP在线客服系统源码部署教程

仿微信聊天源码