Page 1 sur 1

enlever Javascript de HTML

Posté : 04 oct. 2022, 10:39
par Sylvain255
Bonjour,
j'ai un formulaire avec un champ tinyMCE. Ce champ est plus tard affiché. Ce sont des articles. Le problème est qu'un pirate peut créer un formulaire pirate pour enregistrer ce qu'il veut dans le champ HTML y compris du Javascript. Le problème de filtrer le HTML n'est pas simple car il y a les <script>, les onmouseover et autres événements, les <a href="javascript: etc etc. J'ai trouvé ce sujet intéressant : https://stackoverflow.com/questions/415 ... -from-html. Mais JSoup est du Java. Mon appli tourne sur un serveur dédié donc je peux installer Java. Ma question est comment interfacer JSoup qui est du Java avec PHP. Merci de m'aider.
Bien cordialement

Re: enlever Javascript de HTML

Posté : 04 oct. 2022, 13:44
par Sylvain255
finalement j'ai réussi, comme j'ai un serveur dédié j'y ai installé java et créé une application en Java utilisant JSoup qui lit un fichier texte HTML et qui recrache un fichier corrigé.
Ensuite j'ai créé une fonction PHP qui prend une chaîne HTML en entrée, qui l'écrit dans le fichier texte en entrée de mon programme Java et qui recrache le contenu du fichier texte de sortie du programme Java. Je lancele programme Java par la fonction exec de PHP. Enfin le programme Java et ses fichiers texte d'entrée et de sortie sont situés dans un dossier dans lequel j'ai ajouté un .htaccess "deny from all".

Re: enlever Javascript de HTML

Posté : 04 oct. 2022, 14:36
par @rthur
Beaucoup plus simplement, tu pouvais le faire en PHP, il existe plusieurs librairies pour ça comme celle-ci :
http://htmlpurifier.org/