スキップしてメイン コンテンツに移動

definition of continuity by Topology

Introduction


Today, I will write definition of continuity of function by definition of an open set.
I wrote this post about the definition of Topology space, open set, and a thing that open set satisfy the axiom of Topology, but I did not write about continuity of function by definition of an open set. Actually, It is very important.

Overview

  •  Open set
  • $\epsilon-\delta$ reasoning
  • definition of continuity of function by an open set
  • Equivalence


Open set

Let (X,d) is distance space.
$A \subset X$ is open set
$$\iff$$
$$\forall x \in A,~~\exists \epsilon > 0, ~~s.t.~~ B(x,\epsilon) \subset A$$

here,$$B(x,\epsilon):= \{y\in A| d(x,y) < \epsilon\}$$

This definition of open set satisfies Axim of Topology. It written the last time post.

$\epsilon-\delta$ reasoning

I will explain the $\epsilon-\delta$ reasoning. This reasoning is learned in bachelor third student at Univ.

Let f:X-> Y: map
f is countinous where $x=x_0$
$$\iff$$
$$\lim_{x \rightarrow x_0} f(x) = f(x_0)$$
$$\iff$$
$$\forall \epsilon > 0,~~\exists \delta >0 ~~s.t~~ d(x,x_0) < \delta \implies d(f(x),f(x_0)) < \epsilon $$

definition of continuity of function by an open set

Define1.0

Let $(X,\mathbb{O}_X),(Y,\mathbb{O}_Y)$ is Topology space, and
$f:X \rightarrow Y$ is countinous where $x=x_0$
$$\iff$$
$$f(x_0) \in \forall V:\textrm{open set} \subset Y~~,f^{-1} (V) \subset X ~~\textrm{is open set}$$
here,$\mathbb{O_X}$ and $\mathbb{O_Y}$ is open set family in X,Y, and  $f^{-1} (V) := \{a \in X| f(a) \in V \}$.
This definition is equivalence with $\epsilon-\delta$ reasoning.

Equivalence

- Define 1.0 $\implies$ $\epsilon-\delta$ reasoning
$\forall V, f(x_0) \in V$. Thus, $x_0 \in f^{-1}(V)$.
Because $f^{-1}(V)$ is open set, $\exists \delta > 0 ~~s.t.~~ B(x_0,\delta) \subset f^{-1}(V)$.
Therefore, $\forall x \in X ,~~x \in B(x_0,\delta) \implies x \in f^{-1}(V)$.
$x \in B(x_0,\delta) \iff d(x,x_0) < \delta$
$x \in f^{-1}(V) \iff f(x) \in V$.
here, let radius of V is $\frac{\epsilon}{2}$.
Then, because $f(x) \in V$, $~~d(f(x),f(x_0)) < \epsilon$.

At result, because V is arbitrary,
$$\forall \epsilon ~~\exists \delta ~~s.t.~~ d(x,x_0) < \delta \implies d(f(x),f(x_0)) < \epsilon$$

- $\epsilon-\delta$ reasoning. $\implies$ Define 1.0
$\forall x \in f^{-1}(V)$, because $f(x) \in V$ and $f(x_0) \in V$, $d(f(x),f(x_0)) < \epsilon$. here, let $\frac{\epsilon}{2}$ is redius of V.
by $\epsilon-\delta$  reasoning, $\exists \delta > 0 ~~s.t.~~ d(x,x_0) < \delta$.

Let $B(x,\delta):= \{y \in X|d(x,y) < \delta \}$.
$\forall y \in B(x,\delta),$ because $d(x,y) < \delta$, $d(f(x),f(y)) < \epsilon$. Thus, $f(y) \in B(f(x),\epsilon) \subset V$ because $V$ is open set.
Because $f(y) \in V$, $y \in f^{-1}(V)$.
Thus, $y \in B(x,\delta) \implies y \in f^{-1}(V)$.
At result, $B(x,\delta) \subset  f^{-1}(V)$.
Therefore $f^{-1}(V)$ is open set.

Q.E.D

コメント

このブログの人気の投稿

カーネルK-means 理論編

Introduction English ver 今日は、カーネルK-meansの理論について書きます。カーネルK-meansは通常のK-meansの欠点を補うことができます。通常のK-meansの欠点とカーネルK-meansの強みも説明します。もし、まだ御覧になられていなければ、通常の K-means 理論編 の記事を見ていただけるとよいのではないかと思います。 カーネルK-meansの実装編 も併せてご覧ください。 概要 K-meansの弱点 カーネルトリック カーネルK-means アルゴリズム K-meansの弱点 例えば、次のようなデータを用意します。 このデータはK-meansによってうまく分類することはできません。なぜなら通常のK-meansでは、データとプロトタイプのユークリッド距離に依存しているからです。そのため、このような円状に分布しているデータはうまく分類することができません。 プロトタイプとはそれぞれのクラスにあり、そのクラスを代表するようなもののことです。K-meansでは各クラスの平均ベクトルとなります。それゆえ、以下のような分類になってしまいます。 このようなデータではK-meansはうまくいきません。 K-meansで分類できるデータセットは次のように各クラスで固まっている必要があります。 カーネルK-meansはK-meansの弱点を補います。 カーネルトリック 初めに、カーネルトリックを説明します。 線形分離できないようなデータ$X$を例えば次のように線形分離できるように$\phi(x)$に送る写像$\phi$を考えます。 カーネルは次のように定義されます。 $$K(x,y) = \phi(x)^T \phi(y)$$ $\phi$を具体的に計算することは難しいですが、$K(x,y)$を計算することなら簡単です。 この手法をカーネルトリックと呼ばれます。 カーネルK means K-meansの目的関数を復習しておきます。 $$J = \sum_{n=1}^{N} \sum_{k=1}^{K} r_{nk} ||x_n-\mu_k||^2$$ ここで、 プロトタイプは$\mu_i ~\forall k \in K$としま...

Kullback-Leibler divergence

Introduction sorry, this page is Japanese only.   今日がダイバージェンスについて書いていきます。 ちなみにエントロピーの知識を使うのでエントロピーの記事も見てあげてください。 エントロピーの記事はこちら Kullback-Leibler Divergence 二つの確率分布の平均エントロピーの差を表す値をKLダイバージェンスといいます。 式では次のように定義されます。 $$KL(P||Q) = \int_{-\infty}^{\infty} P(X) log \frac{P(X)}{Q(X)}$$ 離散の場合は $$KL(P||Q) = \sum_{i} P(X_i) log \frac{P(X_i)}{Q(X)}$$ なぜ二つの分布間の距離をこのように定義できるのでしょうか。 式の解釈 真の分布P(X)が存在するとします。しかし、有限のデータから真の分布P(X)を求めるのは難しいです。そこで、有限のデータから推定して得られた確率分布をQ(X)とします。では真の分布P(X)と推定した分布Q(X)はどれだけ違っているのでしょうか。 ここで登場するのがエントロピーです。エントロピーはその分布の不確実性を示す値でした。 エントロピーが高いほど不確かなことが起こるとゆうことです。 P(X)のエントロピーとは$-\int_{-\infty}^{\infty} logP(X)$でした。 では推定した確率分布Q(X)は確率分布P(X)に対してどれだけ不確実性を持っているのでしょうか。エントロピーとは情報量の期待値でした。確率分布Q(X)が持つ情報量は$-logQ(X)$です。この情報量を確率P(X)で期待値をとります。 式は以下のようになります。 $$-\int_{-\infty}^{\infty} P(X) logQ(X)$$ この値と真の分布のエントロピーとの差を二つの分布間の差として定義します。式では以下のようになります。 $$-\int_{-\infty}^{\infty} P(X) logQ(X) - (--\int_{-\infty}^{\infty} P(X) logP(X)))$$ これを式変形すると $$-\int_{-\infty}^...

ダイクストラ法

Introduction English ver 今日は、ダイクストラ法について書きます。ダイクストラ法とは最短距離を求めるアルゴリズムです。地図はグラフで表されます。もし、まだ this page を見ていない方は先にこちらをご覧ください。今回はこの記事を前提としています。このページでは、グラフの定義と、ヒープ構造について書いています。ダイクストラ法ではヒープ構造を使って、かなりの計算量を落とします。 この スライド はダイクストラ法を説明したスライドです。 Overview アルゴリズム 実装 アルゴリズム このアルゴリズムは スタート始点のノードを決める。そして、それをAと名付ける。 各ノードに$d=\infty$を割り当てる。ただし、スタート地点はd=0 Aの隣接ノードのリストをadj_listと名付ける。  For adj in adj_list:  If d of adj > d of A + weight to adj -> d = A + weight to adj. グラフnetworkからAを取り除く グラフnetworkの中で最初のdを持っているノードをAとし、4に戻る。 となっています。 このアルゴリズムを図を用いて説明します。  このグラフを使って説明します。  初めに、スタート地点を決めます。そして、各ノードに$d=\infty$を割り当てます。  Aから始まります。Aの隣接ノードであるBのdを更新します。もし、現在のBよりもAのdとA->Bへの重みを足したもののほうが小さいならdをその値に更新します。同じようにCnのdを更新します。 次にAを取り除きます。  次はBから始まります。Aと同じことをやります。 このダイクストラ法では今のような操作をグラフの全てのノードに×がつくまで続きます。 実装 このアルゴリズムでは$O(log(|V|^2))$という計算量を持っています。最小のdを持つノードを探すのに時間がかかります。 しかし、ヒープ構造を使えばO((E+V)log(V))に減らせます。ヒープ構造で現時点での...