On construit donc Pn(f) à partir des valeurs de f aux points 0, 1⁄n, …, (n – 1)⁄n et 1 mais, en ces points, la valeur de Pn(f) peut être différente de celle de f, autrement dit : l'approximation obtenue n'est pas une interpolation.
Il convient de noter que si X est une variable aléatoire suivant une loi binomiale de paramètres(n,x), alors Pn(f)(x) n'est rien d'autre que l'espérance de f(X/n), c'est-à-dire la moyenne de f appliquée au nombre de succès de n expériences indépendantes de probabilité x.
La convergence simple de Pn(f) vers f est alors une conséquence immédiate de la loi faible des grands nombres. En majorant la probabilité de l'écart entre X⁄n et x, on en déduit la convergence uniforme.
Soit δ > 0 et x ∈ [0;1]. Soit k ∈ {0,...,n}. Il y a deux cas possibles pour k :
Si .
Dans ce cas, . Vu que Bn k(y) ≥ 0 pour tout y ∈ [0;1], on a :
Si .
Soit . On pose yj = x + jk/n-x/M+1 pour j ∈ {0,...,M+1}.
On remarque alors que pour j ∈ {0,...,M}, on a |yj+1 – yj| < δ. Ainsi :
Ainsi, pour tout x ∈ [0;1], on peut écrire :
Finalement, choisir δ = 1/√n permet de conclure.
Ce résultat permet d'assurer une certaine vitesse de convergence de la suite de polynômes de Bernstein vers la fonction f, en fonction du module de continuité de f.
↑(en) Francesco Altomare, « Korovkin-type Theorems and Approximation by Positive Linear Operators », Surveys in Approximation Theory, vol. 5, , p. 92-164 (arXiv1009.2601), Theorem 3.6.
↑(en) Michelle Schatzman, Numerical analysis: a mathematical introduction, Oxford University Press, 2002, Theorem 5.3.2