Audio Headsets Kopfhörer Mikrofone Sound System Testberichte

Roccat Khan Aimo im Test – besser als das Roccat Khan Pro oder nur anders und bunter?

Mikrofon-Messung und Sound-Check

Zunächst messen wir auf Wunsch auch den Frequenzbereich des Mikrofons, um dem Feedback der Leser entgegenzukommen. Dafür nutzen wir erneut unseren Messraum, kehren den Vorgang aber quasi um. Natürlich übersteigt eine echte Reziprozitätskalibrierung als Ausgangsbasis unsere aktuellen Möglichkeiten und der Aufwand überstiege den Nutzen bei Weitem. Deshalb haben wir einen Kompromiss gesucht.

Da wir aber über ein kalibriertes Messmikrofon verfügen, lässt sich durch eine Vergleichsmessung und das Herausrechnen der Unterschiede zumindest eine für unseren Zweck gut verwertbare Kurve erzeugen. Somit ist es also nicht der exakte Frequenzgang des Mikrofons, das würden wir uns gar nicht anmaßen, jedoch eine aussagekräftige Annäherung, die unseren subjektiven Eindruck zudem untermauert.

Mess- und hörbar kann man feststellen, dass es keinen echten Low-Cut gibt und zudem der Bassbereich fast schon überpräsent ist. Daher auch das Poltern beim Zupfen und Drehen am Mikrofonarm. Die Sprachverständlichkeit ist trotzdem noch gut  und der Pegel ausreichend hoch.

Warum man diese etwas tiefenlastige Interpretation gewählt hat, die zugegebenermaßen sehr warm klingt, weiß wohl nur der Supplier. Das gleiche Mikrofon am Khan Pro war ja auch schon leicht basslastig. Was sehr angenehm klingt, sind Sibilanten bzw. Zischlaute, denn der Hochton ist nicht übermäßig dominant.

 

Kopfhörer-Messung

Wie wir testen, haben wir im Grundlagenartikel „Gaming-Headsets: Mythos, Wahrheit und wie wir testen“ bereits sehr ausführlich und transparent dargelegt, denn mit dem üblichen Audio-Geschwurbel von Bassgewittern und Hochtonpeitschen kommt man nicht wirklich weiter. Man muss schon subjektiv gut zuhören können und parallel dazu auch messen. Beginnen wir zunächst mit Letzterem.

Kommen wir nun zur Messung der Kopfhörer-Qualität. Ich habe den Frequenzverlauf wiederum bei 1 KHz auf 0 dB normiert, so dass man einerseits gut den Gesamtverlauf mit allen Zugaben und Frequenzabfällen bewerten kann und andererseits auch nicht ganz die Vergleichsmöglichkeit zu vorangegangenen Messungen verliert. Aber es ist trotzdem anders, weil ja die Glättung (1/1 Oktave) durch die nahezu ungeglättete Darstellung (1/24 Oktave) ergänzt wird. Das alles sieht dann natürlich deutlich „hibbeliger“ aus, passt aber auch wesentlich besser zur Realität. Denn eines ist auch klar: es gibt sie nicht, die ideale Kurve.

Doch beginnen wir zunächst mit der geglätteten Kurve, weil sie sich einfacher erklären lässt. Was wir sehen ist eine typische Badewanne mit unterpräsentierten Mitten und sehr dominanten Höhen. Der Bass ist da, aber sehr zurückhaltend, was natürlich dem Pegel entgegenkommt, wenn man den maximalen Schalldruck sucht. Stellt man allerdings mit dem Equalizer alles so ein, dass ich ein neutrales Ergebnis messen kann, ist die Pegelfestigkeit hinüber, weil sich der Verstärker mit seinen 15 mW pro Kanal bereits übernimmt.

Schieben wir nun die PR-kompatible Darstellung beiseite und betrachten den ungeglätteten Kurvenverlauf. Hier spielt natürlich auch noch das „nur“ semi-professionelle Messequipment eine Rolle, aber trotzdem fällt das Gemessene auch hier sehr ähnlich aus. Wir sehen hier noch einmal deutlicher, dass die Bassabstimmung im Peak bei ca. 67 Hz, aber noch unter dem in der Grafik normierten Pegel bei 1 KHz liegt. Das ist sicher ein Kompromiss aus Tiefgang und Pegelfestigkeit, aber eben auch hörbar.

Von den 40 KHz laut Datenblatt bleibt am USB irgendwie nichts übrig, obwohl das gleiche Mikrofon bereits andere Kopfhörer und Headsets mit deutlich höheren Frequenzen bis weit über 20 KHz abbilden konnte, die kein goldenes Label tragen. Wobei das mit den 40 KHz sowieso Nonsens ist, weil man dann schon alles Mögliche messen kann, nur kein echtes Nutzsignal. Egal und geschenkt.

 

Kumulative Spektren (CSD und SFT)

Das kumulative Spektrum bezeichnet verschiedene Arten von Diagrammen, die Zeit-Frequenz-Eigenschaften des Signals zeigen. Sie werden durch die aufeinanderfolgende Anwendung der Fourier-Transformation und geeigneter Fenster auf überlappende Signalblöcke erzeugt. Diese Analysen basieren auf dem bereits oben dargestellten Frequenzgangdiagramm, enthalten aber zusätzlich noch das Element Zeit und zeigen nun als 3D-Grafik („Wasserfall“) sehr anschaulich, wie sich der Frequenzgang über die Zeit hin entwickelt, nachdem das Eingangssignal gestoppt wurde. Umgangssprachlich wird so etwas auch „ausklingen“ oder „ausschwingen“ genannt.

Normalerweise sollte der Treiber nach dem Wegfall des Eingangssignals ebenfalls möglichst schnell anhalten. Einige Frequenzen (oder sogar ganze Frequenzbereiche) werden jedoch immer langsam(er) abklingen und dann in diesem Diagramm als länger anhaltende Frequenzen auf der Zeitachse auch weiterhin erscheinen. Daran kann man gut erkennen, wo der Treiber eklatante Schwächen aufweist, vielleicht sogar besonders „scheppert“ oder wo im ungünstigsten Fall Resonanzen auftreten und das Gesamtbild stören könnten.

Zwei Arten eines kumulativen Spektrums werde ich nun testen:

Cumulative Spectral Decay (CSD)
Der kumulative spektrale Zerfall (CSD) verwendet die FFT und ein modifiziertes Rechteckfenster, um den spektralen Abfall der Impulsantwort zu analysieren. Es wird hauptsächlich zur Analyse der Lautsprecher-Antwort verwendet. Der CSD verwendet normalerweise nur eine kleine FFT-Blockverschiebung (2-10 Samples), um Resonanzen im gesamten Frequenzbereich besser sichtbar zu machen und ist somit ein nützliches Werkzeug zur Erkennung von Resonanzen des Wandlers.

Das Bild beim Roccat Khan Aimo ist gut, aber nicht überragend. Man sieht sehr deutlich, dass im Bassbereich kaum Resonanzen bzw. Nachschwingungen auftreten. Das ist gut und zeigt auch, dass hier kein sinnloses mechnisches Sounding für die Bässe betrieben wurde. Zwischen ca. 2 und 6 KHz gibt es hingegen leichte Nachschwinger, die aber nach ca. 2 ms ebenfalls Geschichte sind. Messbar ist das, hörbar auch, wenn man gezielter hinhört und weiß, wonach man sucht. Es könnte aber zumindest auch ein Grund für das Hochton-Peak sein und läge dann am verbauten Treiber.

Short-time Fourier Transform (STF)
Die Kurzzeit-Fourier-Transformation (STF) verwendet das FFT- und Hanning-Fenster, um das zeitlich variierende Spektrum der aufgezeichneten Signale zu analysieren. Hier nutzt man im Allgemeinen eine größere Blockverschiebung (1/4 bis 1/2 der FFT-Länge), um einen größeren Teil des zeitvariablen Signalspektrums zu analysieren, wobei man besonders den Einsatzgebieten wie Sprache und Musik näherkommt.

Im STF-Spektrum sehen wir nun auch sehr schön die Arbeit der Treiber, die sich in einigen Frequenzbereichen leider so manche leichte Schwäche leisten. Dieses „Nachziehen“ bei einigen Frequenzen unterstreicht die Vermutung, dass hier der Hochton auch mechanisch vom Treiber etwas gepusht wird, was ich persönlich eher schade und übertrieben finde.

Was als Resümee bleibt, ist ein akzeptables Einschwingverhalten, eine eher durchschnittliche Performance und die Tatsache, dass man durchaus Resonanzen vorfindet. Das ist für ein Gaming-Headset sicher kein Beinbruch, aber bei Musik würde ich die Latte in dieser Preisklasse durchaus deutlich höher hängen.

Wählbare Sound-Profile (DSP)

Herr, lass es bitte Hirn regnen! Ich weiß zwar nicht, wer diese Kurven kreiert hat, aber so recht überzeugen kann dies alles nicht. Dann doch besser selbst Hand anlegen und abspeichern. Die Software, gibt dies nämlich her. Damit bändigt man sogar die etwas vogelwilden Höhen ein wenig, wenn man denn Wert darauf legt.

 

Subjektives Hörerlebnis

Testen wir nun auch subjektiv, was man im Original geboten bekommt und zwar OHNE das angebotene Sounding. Ich habe das Headset vorher jedoch wie immer fast 5 Tage im Messraum eingesperrt und mit einem ausgewählten Sound-Loop gequält, um erst einmal Betriebsstunden zu schrubben. Was tut man nicht alles für unsere eingefleischten Einspielfanatiker unter den Lesern 🙂

Basswiedergabe

Den Tiefstbass in der Subkontraoktave (16,4 Hz bis 32,7 Hz) testen mit einer Aufnahme von Bachs Toccata und Fuge D-Moll (19 und 25 Hz) sowie der Festival-Ouvertüre 1812 von Tschaikowsky (10 Hz und 12,5 Hz). Das gleiche gilt auch für die unteren Bereiche der Kontraoktave (32,7 bis 65,4 Hz). Die große Basstrommel (Kick Drum), die in der U-Musik ein gern gesehener Begleiter und meist auf ca. 55 bis 60 Hz abgestimmt ist, wird diese Beurteilung dann abrunden.

Der Bass ist eher schwach, aber anwesend und spielt auch sehr tief, wenn man ihn etwas anhebt. Die Basstrommel ist dann auch präsenter, aber mit steigenden Pegeln sinkt leider auch die Pegelfestigkeit in den Spitzen. Beim Gaming und in Filmen mit guter Effektspur sind z.B. Explosionen anwesend aber nie vordergründig oder dominant. Der Bass ist alles in allem ok, aber keine Ohrenweide. Anwesend ja, aber ganz schön unauffällig.

Der Oberbass bis 150 Hz, in dem auch die Große Oktave (65,4 bis 130,8 Hz) liegt, beherbergt die Sprachgrundfrequenz der männlichen Stimme und entscheidet sehr stark über die naturgetreue Wiedergabe männlicher Vocals.

Männliche Vokals wirken eher engvolumig und flach, egal wie tief der Grundton des Sprechers ausfällt. Dieser Spielart kann man allerdings mögen, das muss jeder mit sich selbst ausmachen. Für Spiele passt das durchaus denn die Sprachverständlichkeit steigt, bei Musik habe ich da aber so meine leichten Zweifel, zumindest in Bezug auf meine eigenen (eher konservativen) Hörgewohnheiten.

Mitteltonbereich

Die unteren Mitten (auch Grundtonbereich) liegen bei ca. 150 bis 400 Hz. Zusammen mit dem bereits erwähnten Oberbass spielt dieser Bereich eine sehr wichtige Rolle für die subjektiv empfundene Wärme bzw. Fülle des Klangbildes. Die Sprachgrundfrequenz weiblicher Stimmen ist in diesem Bereich zu finden.

Weibliche Vocals sacken genauso ab und bei 400 Hz ist die Talsohle dann endgültig erreicht. Das führt in der Konsequenz dazu, dass viele Grundtöne von Instrumenten oder Vocals schwächeln oder sogar fast fehlen und alles somit auch recht kühl und distanziert klingt. Das ist in dieser Form echt nicht meins, aber es soll ja Leute geben, die gerade das besonders mögen. Da will auch auch nicht eigeninnig urteilen.

Die oberen Mitten zwischen 400 Hz bis etwa zwei KHz beinhalten bei einem KHz eine Marke, die immer noch als Referenz für viele Messungen gilt. Das merkt man leider auch oft bei günstigeren Geräten, da die Hersteller oft versuchen, gerade diese Frequenz etwas überzubetonen. Auch beim Gaming spielt dieser Bereich keine unbedeutende Rolle und eine ausgewogene Wiedergabe trägt nicht unwesentlich zu einer guten räumlichen Auflösung bei.

Das alles kommt mit steigender Frequenz wieder sauberer, deutlicher und auch differenzierter ans Ohr. Die Tiefenstaffelung ist sogar recht gut, was mich dann schon etwas überrascht hat. Dazu kommt auch die leichte Anhebung am oberen Ende, die besonders der räumlichen Abbildung sehr entgegen kommt. Sagen wir es mal so: man hört wirklich, was man hören sollte.

Hochtonbereich

Zwischen zwei bis etwa 3,5 KHz ist das menschliche Gehör am empfindlichsten, zumal dieser Bereich der unteren Höhen für die gute Oberton-Wiedergabe der menschlichen Stimme zuständig ist. Dieser Frequenzbereich ist nämlich entscheidend für die Wiedererkennung einer Stimme oder eines Instrumentes; man spricht in diesem Zusammenhang auch von der jeweiligen Klangfarbe.

Für mich ist das alles too much, denn die Überbetonung wirkt hier auf der eh schon physiologischen Empfindlichkeit wie ein Turbo. Der Gamer wird hier allerdings bestens bedient, denn er bekommt durch diesen recht speziellen Peak genau den Frequenzbereich stärker aufs Ohr, den er glaubt, beim Spielen bei Strafe seines Untergangs nicht missen zu können. Mit der Abstimmung kann man als Zocker sicher leben, aber bitte keine Musik damit hören. Die Wiedererkennung von Stimmen leidet enorm, es ist vieles einfach nur unpräzise drüber. Schade, aber ich schrieb ja zu diesem Phänomen bereits bei der Analyse der kumulativen Spektren.

Die mittleren Höhen (3,5 bis sechs KHz) entscheiden über das Ge- oder Misslingen der Sprachwiedergabe als Gesamtbild, denn die S- und Zischlaute (Sibilanten) fallen in diesen Bereich. Die oberen Höhen reichen dann bis ca. zehn KHz, um in den Superhochton überzugehen.

Das eben Erwähnte setzt sich sogar noch mit einer leichten Steigerung fort. Das unterstreicht den kühlen, fast schon metallischen Charakter, der beim Gaming zwar durchaus zu akzeptieren ist, jedoch beim Musikhören zum Aufgeben geschulter Gehöre führt. Das macht einfach keinen Spaß, denn ich bin ja auch keine akustische Hafermastgans, die man bis zum Erbrechen mit Hochton stopfen kann. Aber zumindest glaubt man dann auch Gegner wahrnehmen zu können, die noch gar nicht programmiert wurden.

Zusammenfassung und Fazit

Als Gaming-Headset ist das Roccat Khan Aiomo sicher ganz gut zu gebrauchen, was auch mein subjektiver Hörtest parallel zu den umfangreichen Messungen bestätigt. Optik und Haptik gehen zudem in Ordnung und der RGB-Fummel bleibt wohltuend im Hintergrund. Die Materialanmutung ist ok, aber nicht herausragend. Dafür ist der Tragekomfort recht hoch, was auch an der praktischen Gelenkmechanik liegt. Klanglich sind allerdings gewisse Abstriche zu machen.

Was dem Anwender nämlich kaum einen Mehrwert bringt, ist die nur durchschnittliche Xear-Surround-Lösung des günstigen All-in-One-Chips von C-Media, der zudem bei der Verstärkerleistung hintenraus etwas schwächelt. Denn der auftretende Klirr ist bei der Vollaussteuerung und den nur 15 mW pro Kanal schon gut hörbar. Der messbare Frequenzbereich ist nicht ganz so optimistisch, wie die Herstellerangabe es suggeriert, die sich zudem ganz offensichtlich nur auf den verbauten Treiber bezieht. Denn der USB-Chip schafft dies im Analog-Zweig nie und nimmer.

Wo also sollte man das Roccat Khan Aimo einordnen? Musikgenießer und Bassisten sind hier an der falschen Adresse, Sniper und Fußgeräuschdetektoren dann schon eher. Ganz pegelfest ist das Headset zwar nicht, aber Granaten haben schon eine natürliche Verzerrung bei der finalen Wahrnehmung. Auch am PC. So gesehen passt das also noch. Gaming ja, Musik aber eher nein.

 

Für die ganz Lesefaulen habe ich das alles noch einmal als YouTube-Video. Mit etwas verbalen Kleiser. Lohnt sich also 🙂

 

 

 

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung