Regex pour supprimer tous les attributs d'un paragraphe

Je sais que Regex ne devrait généralement pas être utilisé pour analyser le contenu html. Dans mon cas particulier, j'ai besoin d'eux (la raison en est, j'utilise un éditeur de rte et, lors du collage dans l'éditeur, un remplacement des attributs des paragraphes doit être effectué).

J'ai quelque chose comme

<p attribute1="val1" attribute2="val2" attribut="val3" ...>text blah blah</p> 

Et j'ai besoin de tous les attributs dépouillés afin que je reçois

 <p>text blah blah</p> 

Comment cela peut-il être fait en utilisant un regex?

Une solution pour éliminer les attributs de toutes les balises html possibles est également appréciée.

Quelque chose comme ça devrait fonctionner sur toutes les étiquettes:

 replace(/<\s*(\w+).*?>/, '<$1>') 

Pour les paragraphes seulement, il suffit de remplacer le \w :

 replace(/<\s*p.*?>/, '<p>') 

Le \s* au début permet l'espace blanc avant le nom de la balise, donc si vous avez pour une raison quelconque < p class="foo"> , cela fonctionne aussi.

Parce qu'une balise html ne peut pas avoir d'espaces avant le nom de la balise et peut continuer sur plusieurs lignes, je le recommanderais à la place:

 replace(/<(\w+)(.|[\r\n])*?>/, '<$1>'); 

Et pour les paragraphes seulement:

 replace(/<p\s+?(.|[\r\n])*?>/, '<p>'); 
 perl -lpe 's/(<\w+)\s+[^>]*/$1/'