Yo24hua
727 Beiträge
schrieb am 13.09.14 um 00:47 Uhr zuletzt bearbeitet von Yo24hua am 13.09.14 um 01:07 Uhr
Link zu diesem Post

Hi Alex,

Ich möchte das im "Forum // Help & Questions // bayerwaldradio" zuletzt angesprochene sowie alles andere um das Thema "RegEx Engine" hier weiter führen da ich denke das dies dort nicht zwingend hingehört!

Erst einmal danke für die dort aufgeführte doch recht brauchbare Erläuterung des Fallbackmechanismus;-)


1. Problemfall:
STREAM: "RGDR HITRADIO" gelegedlich auch mit anderen namen (Z.b.: "RGDR_Ruebe")

1a.Fehler:
Die RegEx "(?i)(\d+[^a-z]*)?(?P<a>.*) - (?P<t>.*?)(( - RGDR.*)|( RGDR.*)|( -.*On.*Air.*))" wird trotz längeren bestehens (am: 2014-08-02 zuletzt editiert) und aktualisierung des Stream-Browsers nicht zum Client übertragen.

1b.Fehler:
Nach Manueller übertragung von der Daten-Setzen Seite zum Client funktioniert das nur wenn die benannte RegEx die einzigste ist (Vorausgesetzt ist natürlich das der Sender das zum zeitpunkt auch in den entsprechenden Formaten sendet).
Gemischt (In der reihen folge wie sie auch auf der Daten-Setzen Seite aufgeführt werden getestet) mit den anderen RegEx's funzt das leider nicht. Auf der Daten-Setzen Seite funzt es ohne Probleme.
In anderen reihenfolgen hab ich das jetzt nicht getestet. Nach deiner Erläuterung ist die Reihenfolge wie die RegEx's im Client eingetragen werden wohl nicht relevant wenn ich das richtig verstanden habe?!

Generelle Problematik solcher RegEx Typen (mit mehrfachen oder "|" am Ende):
Allgemein habe ich ja leider schon öfters Probleme mit verschiedenen Engines (Pyton, Java, …)
feststellen müssen. Soweit ich heraufinden konnte bestehen da auch abhängigkeiten zu den "Flags" die man dafür intern setzen kann.
Bei www.regexplanet.com nutze ich für die Daten-Setzen ebene als Referenz Test bevorzugt die "Perl" oft auch "XRegExp" Engine (Den Engine Typ kann man dort oben in der Leiste unter "Testen" allerdings ohne verlust der gesetzten Tests umschalten - je nach Typ müssen evtl. "NAMED GROUPS" elemente Entfernt werden).
Habe dort schon etwas für uns vorbereitet man kann seine Experimente dort mit den "Teilen Code erzeugen" Button dauerhaft speichern: http://fiddle.re/dfpu1

Vieleicht kommt man so dem Problem der unterschiedlichen Engines auf der spur insofern du die Thematik verfolgen magst.

Legalität, Radio Verzeichnisse, Diskographie Verzeichnisse, Reguläre Ausdrücke, Videos...:
Yo24hua's streamWriter Special: > > > https://sites.google.com/site/yo24hua < < <

Alles mit Ruhe & Muse, denn Unmöglich sind nur die Dinge, die man nicht tut!
Befreie dich, Befreie dich, Befreie dich und du wirst deinen Weg finden!
··· ¥oæhua ···
 
Yo24hua
727 Beiträge
schrieb am 14.09.14 um 17:29 Uhr zuletzt bearbeitet von Yo24hua am 14.09.14 um 23:13 Uhr
Link zu diesem Post

2.Problem (Ich erwähne dies trotz niedrieger Relevanz mal):
Betrifft Streamdatenseite:
Beispiel Stream: "Germany - Radio | Das Beste aus Discofox und Schlager".
Dort werden in den Titelinformationen 2 und mehr Leerzeichen zwischen Titel und angehängten Zusätzen (Moderatoren etc.) gesendet die aber auf der Webseite nicht ersichtlich sind.

Beispiel: "ARTIST - TITLE___Schebby/Studio Bochum"
(Leerzeichen durch Unterstriche ersetzt da diese hier auch eliminiert werden).

Das ganze irritierte mich etwas wie es möglich sein kann das der RegEx Part "(\s{2,9}.*)" dort so sicher greift obwohl auf der Seite jeweils "nur" EIN Leerzeichen erkrennbar ist.

Wäre ganz gut wenn sich da was machen liese da solche Formate öfters auch bei anderen Sendern vorkommen.


EDIT:
Zu 1.Problem:
Hier noch ein weiterer Stream bei dem es Probleme im Client gibt:
"Radio-Wattwurm"
Die Datenwebseite ist allerdings mit mehrfachen doppel überladen und enthält eindeutig Fehlerhafte bzw. Veraltete RegEx.

Legalität, Radio Verzeichnisse, Diskographie Verzeichnisse, Reguläre Ausdrücke, Videos...:
Yo24hua's streamWriter Special: > > > https://sites.google.com/site/yo24hua < < <

Alles mit Ruhe & Muse, denn Unmöglich sind nur die Dinge, die man nicht tut!
Befreie dich, Befreie dich, Befreie dich und du wirst deinen Weg finden!
··· ¥oæhua ···
 
alex
2549 Beiträge
schrieb am 19.09.14 um 20:16 Uhr
Link zu diesem Post
Moin!

Ich tue diesen Thread mal auf die TODO-Liste. Mal sehen, wann ich dazu komme, mir das anzuschauen. Wird aber auf jedenfall passieren - bei der perversen RegEx (1a Fehler) werde ich schon neugierig:-D
LG/Best regards, Alex

"Journalism is printing what someone else does not want printed. Everything else is public relations."
- George Orwell

D1734FA178BF7D5AE50CB1AD54442494
 
Yo24hua
727 Beiträge
schrieb am 19.09.14 um 21:03 Uhr zuletzt bearbeitet von Yo24hua am 28.09.14 um 13:15 Uhr
Link zu diesem Post

Hi Alex,
Ich hatte dir speziell Sender herausgesucht bei den der Formatwechsel häufiger vorkommt!
Da gibt es natürlich noch viel mehr bei dennen die Probleme auftreten sind aber auch etliche dabei die nicht immer, nur WE oder zu bestimmten Tageszeiten eben halt ihre Formate ändern.

EDIT !:
Perverse RegEx ?! - Die hier ist Pervers:
"(\d{3,9}(\s*\-*\)*\s*)*)?(\d{2}'?s(.*\d{2}'?s)?( *- *)+)?(\d{2}'?s Music )?(Oldies - )?(?P<a>.*?)( - \d+('s.*)? - |_-_| *- *)(?P<t>.*?)(\s(\(|\[)(\d{2}'?s.*)(\)|\]))?(\s*\(\d+\))?(\s\[.{3}\])" (ohne Anführungszeichen).
Das ist die momentan extremste die ich auf lager hab:-D:-D:-D. Sie funzt auch noch wie dumm und bisweilen sogar fehlerfrei! Prüfphase ist mit diesem Edit hier jetzt abgeschlossen und auf der Stream-Datenseite gesetzt. Der zugehörige Sender lautet: "Caroline International/319/558".
Auf meiner Datensammelungs Webseite (Database) ist das auch näher dokumentiert.

Neuigkeiten von mir:
Bin dabei "Probleme und Fehler" durch falsch gesetzte RegEx auf meiner Webseite zu Thematisieren sowie meine Datensammlung auf die Webseite zu bringen. Der Anfang dafür ist schon gelegt.
Vieleicht kann dir diese Sammlung ja bei der Fehler beseitigung auch nützlich sein!
Die Datensammlung ist allerdings etwas versteckt und das bleibt auch so. Ich kann dir gerne den Zugriffspunkt via PM dafür nennen. Am sonsten lautet mein Motto: "Wer wirklich interessiert ist wird es auch finden"!

LG
Yo24hua

Legalität, Radio Verzeichnisse, Diskographie Verzeichnisse, Reguläre Ausdrücke, Videos...:
Yo24hua's streamWriter Special: > > > https://sites.google.com/site/yo24hua < < <

Alles mit Ruhe & Muse, denn Unmöglich sind nur die Dinge, die man nicht tut!
Befreie dich, Befreie dich, Befreie dich und du wirst deinen Weg finden!
··· ¥oæhua ···