Annoter les données entre les balises

J’essaie d’écrire une règle pour détecter les données entre les balises de balisage.

Le format des données d’entrée est fixe par exemple

 Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ulsortingcies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim  nascetur ridiculus mus. Donec quam felis, ulsortingcies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim 

Ce dont j’ai essentiellement besoin ici pour détecter les données entre les balises de début et de fin dans mon cas, la sortie devrait être 1 et 2

J’essaie la règle ci-dessous.

  Document{->ADDRETAINTYPE(MARKUP)}; STRING sStart = ""; DECLARE spanStart; DECLARE spanEnd; DECLARE ZONE; sStart -> spanStart; sEnd -> spanEnd; spanStart NUM spanEnd{->MARK(ZONE,2)}; 

Mais la valeur n’est pas détectée car 1 & 2 ne sont pas détectés comme numéro

“1” et “2” ne sont pas détectés comme NUM car ils sont des MARKUP. L’ensemencement crée un partitionnement non chevauchant distinct du document. Si vous voulez créer une annotation dans une plus petite partie, par exemple, dans votre cas d’utilisation MARKUP, vous pouvez le faire avec une règle de regex simple comme vous l’avez fait dans votre question avec spanStart et spanEnd.

Je voudrais utiliser quelque chose comme:

 MARKUP->{"\\d+"-> ZONE;}; 

ou

 MARKUP->{""-> 1 = ZONE;}; 

AVERTISSEMENT: Je suis un développeur de UIMA Ruta