Cette œuvre emploie des sons sinusoïdaux, produits par des moyens purement électroniques, et des sons chantés qui s'articulent en un vaste ensemble allant de la parole nettement intelligible (citant le troisième chapitre du Livre de Daniel) aux bruits et aux sons complexes.
Stockhausen superpose la voix d'un unique jeune garçon à elle-même, afin de produire de véritables contrepoints vocaux d'une grande richesse. La construction générale est linéaire et les échelles de micro-intervalles largement utilisées. Gesang der Jünglinge est un des tout premiers exemples réussis de synthèse entre une musique purement électronique (réalisée à partir de générateurs sinusoïdaux) et une musique « concrète » (faite d'une voix enregistrée puis retravaillée).
La partition prévoit pour la diffusion cinq groupes de haut-parleurs disposés tout autour des auditeurs. Cette répartition spatiale du son répond – comme dans les autres pièces électroacoustiques de Stockhausen – à un souci éminemment structurel de la composition (jouant notamment sur la couleur, les changement de rythme ou de dynamique) et non à une simple extension des paramètres de la perception. La direction du son, son évolution dans l'espace exercent donc une action déterminante sur la forme même de l'œuvre qui appartient à ce que le compositeur nomme une forme statistique dans laquelle il essaie de « médiatiser des ensembles collectifs – organisés selon les lois des grands nombres – avec des groupes et des éléments particularisés. Le problème est de concevoir et de faire percevoir les mêmes éléments de manière qu'ils paraissent, selon certaines conditions, comme un ensemble collectif (c'est-à-dire sous forme de complexe déterminé statistiquement, de phénomène de masse) ou bien, de manière qu'ils soient perçus comme groupe ou en tant qu'éléments particularisés. » (Stockhausen)