SIP (Session Initiation Protocol) とは、IP ネットワーク上で音声通話やビデオ通話のセッション (接続) を確立・変更・終了するための通信プロトコルです。IETF (Internet Engineering Task Force) が策定した RFC 3261 で標準化されており、VoIP の事実上の標準規格として、現代の電話インフラの基盤を担っています。
SIP は HTTP に似たテキストベースのプロトコルで、人間が読める形式のメッセージをやり取りします。主要なメソッドとして、INVITE (発信要求)、100 Trying (処理中)、180 Ringing (呼び出し中)、200 OK (応答)、ACK (応答確認)、BYE (切断) があります。重要な点として、SIP 自体は通話の「制御」のみを担当し、実際の音声データは RTP (Real-time Transport Protocol) で別経路で伝送されます。この制御と音声の分離が SIP の設計上の特徴です。
SIP トランクは、企業の電話システムと通信事業者を IP 回線で接続するサービスです。従来は PBX と通信事業者の交換機を物理的な中継回線 (アナログ回線や ISDN 回線) で接続していましたが、SIP トランクに置き換えることで、回線コストの削減、回線数の柔軟な増減、複数拠点の番号統合が可能になります。クラウド PBX サービスの多くは SIP をベースに構築されています。
SIP のセキュリティ上の課題として、暗号化されていない SIP 通信は盗聴や改ざんのリスクがあります。対策として、SIP over TLS (SIPS) で制御信号を暗号化し、SRTP で音声データを暗号化する構成が推奨されます。また、SIP サーバーへの不正アクセス (SIP ブルートフォース攻撃) により、企業の電話回線が乗っ取られて国際電話を大量発信される被害も報告されています。IP 電話や VoLTE の基盤技術として、SIP の理解は電話インフラを扱う上で不可欠です。