Articles of indexation

Indexer un tas de fichiers texte

Je dois rechercher un grand nombre de fichiers texte (sur tous les disques d’un serveur Unix) pour une chaîne donnée (je dois le faire). Compte tenu du temps et des ressources que cela nécessitera, je pense que la liste des fichiers qui contiennent le jeton en question est un maigre résultat par rapport à l’investissement. […]

Comment indexer le champ blob dans l’indexation Apache Solr?

J’utilise Apache Solr pour indexer mes données, j’ai un champ blob que je veux aussi indexer … mais je ne sais pas quel est le fieldType à déclarer dans le fichier “scheme.xml” …. J’ai essayé de suivre: “field name =” abstract “type =” text “indexed =” true “saved =” true “required =” true “” mais […]

Pourquoi index.php ne fonctionnerait-il qu’une partie du temps?

Je viens de déplacer un site de développement sur un serveur de production de test et je teste certaines choses. Lorsque vous accédez à l’URL racine (par exemple rooturl.com), le navigateur rooturl.com/index.php correctement rooturl.com/index.php sans afficher le rooturl.com/index.php index.php dans la barre d’adresse. Cependant, j’ai aussi un répertoire sur rooturl.com/admin qui rooturl.com/admin également un fichier […]

Prise en compte de la haute disponibilité et des performances avec index secondaire dans Cassandra

J’ai un set up avec : 5 cluster de noeuds Cassandra avec RF = 3, j’ai effectué un index secondaire pour une colonne dans la table ‘user’, 1) Selon mon étude sur l’index secondaire en utilisant le lien: https://www.datastax.com/dev/blog/cassandra-native-secondary-index-deep-dive J’ai compris que les index secondaires seront stockés dans le nœud local . Est-ce que cela […]

Apache Lucene: comment utiliser TokenStream pour accepter ou rejeter manuellement un jeton lors de l’indexation

Je cherche un moyen d’écrire un index personnalisé avec Apache Lucene (PyLucene pour être précis, mais une réponse Java est correcte). Ce que je voudrais faire est le suivant: Lorsque vous ajoutez un document à l’index, Lucene le numérotera, supprimera les mots vides, etc. Cela se fait généralement avec Analyzer si je ne me trompe […]

Problèmes d’installation avec h5ai webindex

J’ai donc essayé d’installer h5ai webindex sur mon serveur Web, mais le fait est que je ne parviens pas à l’installer correctement, car les dossiers h5ai insistent pour apparaître, lorsque j’ouvre un dossier créé par moi puis actualiser la page que l’index retourne à celle par défaut apache. Si quelqu’un pouvait m’aider dans le processus […]

Comment exécuter le serveur Apache-Solr en tant que processus d’arrière-plan?

J’utilise Apache-Solr pour l’indexation et la recherche dans mon application Java. Si vous souhaitez effectuer une opération liée à Apache-Solr, le serveur solr doit être démarré. Parfois, le terminal sur lequel Solr-server s’exécute est fermé accidentellement, nous devons alors redémarrer ce serveur, car nous ne pouvons pas effectuer d’opération liée à Search / Index. J’ai […]

extraire l’extrait de contenu de Apache Solr

J’ai utilisé Solr pour ma table Mysql pour indexer aussi bien que chercher. Où dois-je apporter des modifications est-ce ici? si oui, quoi? explicit velocity browse layout Solritas edismax *:* 10 *,score text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4 text,features,name,sku,id,manu,cat 3 text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4 on cat manu_exact ipod GB 1 cat,inStock […]

Pointage de Solr (4.8.1) vers un répertoire (Windows 7)

Je mets en place un système de recherche pour un répertoire de documents (types de fichiers tels que: MS Word, PDF, .txt, PowerPoint, etc.). Le répertoire des documents est stocké localement sur mon réseau. J’ai Apache Solr opérationnel sur ma machine (volet administrateur visible et accessible depuis le port 893 de localhost). Je dois maintenant […]

Comment indexer les fichiers HTML dans Apache SOLR?

Par défaut, SOLR accepte les fichiers XML, je veux effectuer une recherche sur des millions d’URL analysées (html).