From 5b86df7c1b858974cd1cb4c6198d3d217ebdd4ed Mon Sep 17 00:00:00 2001 From: Ryan Yin Date: Fri, 1 Nov 2024 10:03:27 +0800 Subject: [PATCH] docs: aws ec2 - conntrack_allowance_available --- .../AWS \346\265\201\351\207\217\346\210\220\346\234\254.md" | 4 ++++ ...42\230\350\247\243\345\206\263\346\200\235\350\267\257.md" | 3 +++ .../\345\217\202\346\225\260\350\260\203\344\274\230.md" | 3 +++ 3 files changed, 10 insertions(+) diff --git "a/cloud-provider/aws/AWS \346\265\201\351\207\217\346\210\220\346\234\254.md" "b/cloud-provider/aws/AWS \346\265\201\351\207\217\346\210\220\346\234\254.md" index 75f6a861..a54603c1 100644 --- "a/cloud-provider/aws/AWS \346\265\201\351\207\217\346\210\220\346\234\254.md" +++ "b/cloud-provider/aws/AWS \346\265\201\351\207\217\346\210\220\346\234\254.md" @@ -53,6 +53,10 @@ ALB 可以用 NLB + 自建 L7 网关替代,而 NAT 网关则可以用 不过其中要注意的是,在流量大的情况下 NAT 实例或 L7 网关实例,都可能会遇到 nf_conntrack 表用尽导致 504 等超时错误的问题,需要调整 nf_conntrack 的内核参数扩容该表容量。 +以及 EC2 的 ENA driver 本身存在固定的 conntrack 上限,即使调整内核 nf_conntrack 参数也无法突破这个上 +限,可以通过 AWS 监控指标(如 `conntrack_allowance_available` `conntrack_allowance_exceeded`)来监控 ENA driver 的 conntrack 使用情 +况:[Metrics for the ENA driver - ENA Network Performance](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/monitoring-network-performance-ena.html#network-performance-metrics) + ## FAQ ### 我能否通过加一层 ELB 来避免被收取 Cross Zone 的流量成本? diff --git "a/linux/\346\200\247\350\203\275\344\274\230\345\214\226/Linux 504 \350\266\205\346\227\266\344\270\242\345\214\205\351\227\256\351\242\230\350\247\243\345\206\263\346\200\235\350\267\257.md" "b/linux/\346\200\247\350\203\275\344\274\230\345\214\226/Linux 504 \350\266\205\346\227\266\344\270\242\345\214\205\351\227\256\351\242\230\350\247\243\345\206\263\346\200\235\350\267\257.md" index 5773dd63..02d174dc 100644 --- "a/linux/\346\200\247\350\203\275\344\274\230\345\214\226/Linux 504 \350\266\205\346\227\266\344\270\242\345\214\205\351\227\256\351\242\230\350\247\243\345\206\263\346\200\235\350\267\257.md" +++ "b/linux/\346\200\247\350\203\275\344\274\230\345\214\226/Linux 504 \350\266\205\346\227\266\344\270\242\345\214\205\351\227\256\351\242\230\350\247\243\345\206\263\346\200\235\350\267\257.md" @@ -23,6 +23,9 @@ TCP 连接池,它的 TCP 连接复用率要高得多。 丢包问题的排查方法如下: +> 注意,AWS EC2 等云主机可能会存在固定的 nf_conntrack/PPS/bandwidth 等限制,这些限制是无法通过修改内 +> 核参数来突破的,需要查阅云服务商的文档来了解。 + - [Linux服务器丢包故障的解决思路及引申的TCP/IP协议栈理论 ](https://www.cnblogs.com/276815076/p/5736272.html) ### nf_conntrack 连接跟踪表用尽导致丢包 diff --git "a/linux/\346\200\247\350\203\275\344\274\230\345\214\226/\345\217\202\346\225\260\350\260\203\344\274\230.md" "b/linux/\346\200\247\350\203\275\344\274\230\345\214\226/\345\217\202\346\225\260\350\260\203\344\274\230.md" index f739410f..63415332 100644 --- "a/linux/\346\200\247\350\203\275\344\274\230\345\214\226/\345\217\202\346\225\260\350\260\203\344\274\230.md" +++ "b/linux/\346\200\247\350\203\275\344\274\230\345\214\226/\345\217\202\346\225\260\350\260\203\344\274\230.md" @@ -156,6 +156,9 @@ sysctl -p /etc/sysctl.conf 此外,对于直面客户端的边缘网关,我们很可能还需要调整 tcp timewait 以及 nf_conntrack 相关参数: +> 注意,AWS EC2 等云主机可能会存在固定的 nf_conntrack/PPS/bandwidth 等限制,这些限制是无法通过修改内 +> 核参数来突破的,需要查阅云服务商的文档来了解。 + ```shell echo " # 发起连接时可用的端口范围