Сервер падает при достижении ~600 подключений

DmitryV

New Member
Добрый день,

Используем мощный сервер - 20 ядер, 72гб RAM для веб-конференции. При 7-10 исходящих стримах, при превышении около 600 подключений, сервер падает, при этом все параметры нагрузки на сервер не превышают 40%. Логов, к сожалению, нет.

Настройки сервера:
GNU nano 2.9.8 /usr/local/FlashphonerWebCallServer/conf/flashphoner.properties
# Config flashphoner.properties # To get more settings: # ssh -p 2001 admin@localhost # default password: admin # show node-settings # show node-settings | grep port #server ip ip =wcs2.whenspeak.ru ip_local =10.129.0.23 #webrtc ports range media_port_from =30001 media_port_to =33000 #codecs codecs =opus,alaw,ulaw,g729,speex16,g722,mpeg4-generic,telephone-event,h264,vp8,fl$ codecs_exclude_sip =mpeg4-generic,flv,mpv codecs_exclude_streaming =flv,telephone-event codecs_exclude_sip_rtmp =opus,g729,g722,mpeg4-generic,vp8,mpv #websocket ports ws.port =8080 wss.port =8443 #recording record_streams=true record_flash_published_streams=true record_rtsp_streams=true stream_record_policy_template={streamName}-{startTime}-{endTime} mixer_out_buffer_enabled=true mixer_out_buffer_start_size=3000 encoder_buffer_length_sec=1 webrtc_cc_min_bitrate=30000 webrtc_cc_max_bitrate=393216

Посоветуйте, как действовать.
 

Max

Administrator
Staff member
Надо разобраться что произошло с сервером.

В случае крэша сервера, должен остаться крэшлог error1111.log в /usr/local/FlashphonerWebCallServer/logs
1111 - PID процесса.

В случае убийства процесса системой, например из-за недостатка памяти, должен быть лог в /var/log/messages
Code:
killed process
В случае, если процесс жив, но сервер по какой-то причине завис, процесс должен быть виден в списке
Code:
ps aux | grep java

Основные рекоммендации по тюнингу и приведению сервера в продакшен-состояние

1. Настроить heap в конфиге wcs-core.properties
Code:
-Xms36g -Xmx36g
2. Установить JDK12 или JDK14
В результате, команда должна показывать установленную версию
Code:
java -version
3. Сконфигурировать сборщик мусора ZGC.

4. Увеличить кол-во портов. Убедиться, что порты не пересекаются с другими приложениями в системе.
Code:
flashphoner.properties
media_port_from =30001
media_port_to =40000
 

Max

Administrator
Staff member
Мы проверили Ваш сервер.
Пожалуйста, отключите дебаговые логи сервера обмена по websocket, во время нагрузочных тестов они могут сильно влиять на производительность.
Пожалуйста, уберите из wcs-core.properties дублирующиеся строки (настройка объема памяти и логов сборщика мусора).
В логах сервера мы видим только его ручные перезапуски.
Если сервер снова упадет, соберите отчет, как описано здесь, и вышлите на support@flashphoner.com, либо, если SSH доступы останутся активными, напишите с указанием времени падения, это ускорит анализ логов.
 
Top