← Back

LESSON 06

Network Management & Operations

FCAPS Model

ISO framework for network management:

Component Purpose Example
Fault Detect, isolate, fix issues Router down alert, auto-failover
Configuration Track device settings, inventory VLAN configs, firmware versions
Accounting Track usage, billing Bandwidth per department
Performance Monitor speed, latency, throughput Link utilization graphs
Security Access control, threat detection Firewall logs, intrusion alerts

SNMP vs NETCONF

Feature SNMP NETCONF
Age 1980s (legacy) 2000s (modern)
Data Model MIB (Management Information Base) YANG
Protocol Simple commands (GET/SET/TRAP) XML over RPC
Operations Polling (pull) Push and pull
Transactions Per-device Atomic (all-or-nothing)
Scalability Poor for large networks Excellent
SNMP Example: Network admin polls router every 5 min: snmpget router1 ifInOctets (inefficient)
NETCONF Example: Send one XML config to 100 routers: Change all OSPF timers atomically (all succeed or all fail)

AIOps (AI for IT Operations)

Using AI/ML for network management:

  • Predictive Analytics: Predict failures before they happen (e.g., "Router 5 will fail in 48 hours based on CPU temp trends")
  • Root Cause Analysis: Automatically correlate events to find the real problem
  • Anomaly Detection: Learn normal patterns, flag deviations
  • Auto-Remediation: Fix common issues without human intervention
Example: Network slowdown at 3 PM daily:
Traditional → Manual investigation, check logs, find cause (hours)
AIOps → ML detects pattern: "Backup job starts 3 PM, saturates link" → Auto-reschedules to midnight

FCAPS Model

Network කළමනාකරණය කරන්න ISO රාමුවක්:

  • Fault (ගැටලු): Network ගැටලු හඳුනාගෙන නිවැරදි කරන්න. උදාහරණය: Router එකක් down උනාම alert එක ඇවිත් auto-failover
  • Configuration: සියලුම උපාංග සැකසුම් නිරීක්ෂණය කරන්න. කවුද configuration එක වෙනස් කළේ, කවදාද කියලා වාර්තා
  • Accounting (ගිණුම්කරණය): Bandwidth භාවිතය දෙපාර්තමේන්තු අනුව නිරීක්ෂණය කරන්න. Marketing කණ්ඩායම data 100GB use කළා නම් බිල් කරන්න පුළුවන්
  • Performance: Network වේගය, ප්‍රමාදය නිරීක්ෂණය කරන්න. Graphs වලින් utilization බලනවා
  • Security: ප්‍රවේශ පාලනය, තර්ජන හඳුනාගන්න

SNMP vs NETCONF

SNMP (පැරණි ක්‍රමය - 1980s):

  • සරල විධාන: GET (දත්ත ලබාගන්න), SET (configure කරන්න), TRAP (alerts)
  • Polling: Network manager එක හර් router එකකට ඇහුවනවා "කොච්චර traffic තියෙද?" නැවත නැවතත් (අකාර්යක්ෂම)
  • ගැටලුව: Routers 1000ක් තියෙනවා නම්, හර් එකකට poll කරන්න මන්දගාමී

NETCONF (නවීන - 2000s):

  • XML-පාදක, ක්‍රමලේඛනය කළ හැකි
  • Atomic ගනුදෙනු: Routers 100කට එකම configuration වෙනසක් යවන්න පුළුවන්. සියල්ල සාර්ථක වෙනවා හෝ සියල්ල අසාර්ථක (අර්ධ යාවත්කාලීන නැත)
  • YANG දත්ත ආකෘති: ව්‍යුහගත, විකුණුම්කරු-මධ්‍යස්ථ නොවන වින්‍යාසය

උදාහරණය: OSPF timer එක වෙනස් කරන්න ඕන routers 100කට:
SNMP → හර් router එකට login වෙලා අතින් වෙනස් (පැය ගණන්)
NETCONF → XML පණිවිඩයක් එකම වේලාවේ routers 100කට (තත්පර, දෝෂ-රහිත)

AIOps (AI for IT Operations)

AI use කරලා network කළමනාකරණය කරන්න:

පුරෝකථන විශ්ලේෂණය: ML ඇල්ගොරිතම use කරලා අනාගත ගැටලු පුරෝකථනය කරන්න

උදාහරණය: Router එකක CPU උෂ්ණත්ව දත්ත විශ්ලේෂණය කරලා AI එක කියනවා: "උෂ්ණත්ව ප්‍රවණතාව අනුව router එක පැය 48කින් අසාර්ථක විය හැකියි. ප්‍රතිස්ථාපනය කරන්න." Admin කෙනෙක්ට කලින් සූදානම් වෙන්න පුළුවන්.

විෂමතා හඳුනාගැනීම: සාමාන්‍ය network හැසිරීම AI එක ඉගෙන ගන්නවා. අසාමාන්‍ය ක්‍රියාකාරකම් උනාම flags.

උදාහරණය: Server එකක් සාමාන්‍යයෙන් 10 GB/දිනකට දත්ත හුවමාරු කරනවා. හදිසියේ 100 GB හුවමාරු උනාම AI එක alert: "දත්ත කාන්දු වීම හෝ malware විය හැකියි"

මූල හේතු විශ්ලේෂණය:

සාම්ප්‍රදායික → සිදුවීම්/අනතුරු ඇඟවීම් 100ක් එකම වේලාවේ ඇවිත්. Admin කෙනෙක්ව අතින් විමර්ශනය කරන්න වෙනවා

AIOps → AI එක සහසම්බන්ධ කරනවා: "ආහ්, core router එක down නම් කොච්චර downstream උපාංග අසාර්ථක වෙනවා. මූල හේතුව: core router එක"

ස්වයං-ප්‍රතිකර්ම: සාමාන්‍ය ගැටලු ස්වයංක්‍රීයව නිවැරදි කරන්න

උදාහරණය: දිනපතා 3 PM එකෙන් network මන්දගාමී. AI එක හඳුනාගන්නවා: "Backup කාර්යය link එක සංතෘප්ත කරනවා. මධ්‍යම රාත්‍රියට නැවත සැලසුම් කරමු." අතින් ක්‍රියාමාර්ග ගන්න ඕන නෑ.