enlever Javascript de HTML

Eléphanteau du PHP | 26 Messages

04 oct. 2022, 10:39

Bonjour,
j'ai un formulaire avec un champ tinyMCE. Ce champ est plus tard affiché. Ce sont des articles. Le problème est qu'un pirate peut créer un formulaire pirate pour enregistrer ce qu'il veut dans le champ HTML y compris du Javascript. Le problème de filtrer le HTML n'est pas simple car il y a les <script>, les onmouseover et autres événements, les <a href="javascript: etc etc. J'ai trouvé ce sujet intéressant : https://stackoverflow.com/questions/415 ... -from-html. Mais JSoup est du Java. Mon appli tourne sur un serveur dédié donc je peux installer Java. Ma question est comment interfacer JSoup qui est du Java avec PHP. Merci de m'aider.
Bien cordialement

Eléphanteau du PHP | 26 Messages

04 oct. 2022, 13:44

finalement j'ai réussi, comme j'ai un serveur dédié j'y ai installé java et créé une application en Java utilisant JSoup qui lit un fichier texte HTML et qui recrache un fichier corrigé.
Ensuite j'ai créé une fonction PHP qui prend une chaîne HTML en entrée, qui l'écrit dans le fichier texte en entrée de mon programme Java et qui recrache le contenu du fichier texte de sortie du programme Java. Je lancele programme Java par la fonction exec de PHP. Enfin le programme Java et ses fichiers texte d'entrée et de sortie sont situés dans un dossier dans lequel j'ai ajouté un .htaccess "deny from all".

Avatar du membre
Administrateur PHPfrance
Administrateur PHPfrance | 9782 Messages

04 oct. 2022, 14:36

Beaucoup plus simplement, tu pouvais le faire en PHP, il existe plusieurs librairies pour ça comme celle-ci :
http://htmlpurifier.org/
Quand tout le reste a échoué, lisez le mode d'emploi...