Yo te recomiendo VB-Audio VoiceMeeter Banana.
https://vb-audio.com/Voicemeeter/banana.htm
Tienen un módulo para conectarte por red, ves los niveles de cada interlocutor y puedes modificarle el volumen, compresión, puerta, etc. Muy completo.
Puedes configurar un programa reproductor por otro canal para reproducir las melodías o los FX y te va a dar un audio multipista.
Luego editas el audio, grabado por pistas y sincronizado, con audacity para eliminar ruidos de fondo de las pistas de voz, meter filtros, claridad, recomprimir en caso de necesidad y codificar.
Como uséis el Discord o el Skype no vas a tener un archivo de audio con las diferentes pistas para tocar cada voz en caso de que a alguien se le escuche un poco más bajo o a otro un poco más alto, o para retocar alguna voz regulera.
Si realmente quieres usar Discord o algo parecido, cada uno debería grabar su propio audio, audacity, dar alguna palmada sincronizada al empezar para un postproducción poder sincronizar las diferentes pistas.
Luego ya es saber que el medidor de potencia cuando hablas nunca ha de llegar a la parte roja pero ha de subir y cosa así, porque eso significa que estás saturando el audio, etc.