Il me semble avoir vu passer un post de Hubert décrivant les inconvénients de compatibilité du codage des chaines en utf-8, et à priori le substr() fonctionnerait pas plus

Ce que j'ai voulu dire par là, c'est que PHP 6 saura nativement interpréter l'UTF-8. Ce ne sera pas le cas des tableaux.
Donc substr() sera adapté, et pas besoin de tout recoder.
De plus il existe déjà des solutions (une API) qui gèrent l'UTF-8 en PHP, je ne suis pas sur du nom, mais je crois quelle s'appelle "phputf8".
EDIT :
j'ai retrouvé
QQ chose
EDIT 2 :
Une recherche

avec "phputf8" vous donnera plus d'explications que moi.
Deux choses sont infinies, l'Univers et la sottise humaine!!
Mais je ne suis pas sur de ce que j'affirme au sujet de l'Univers.
A. Einstein